Descripción
Raspar páginas web estáticas y sin complicaciones es fácil de hacer con Python. Sin embargo, la cosa se pone un poco más difícil cuando te enfrentas a cosas como páginas de acceso, casillas de verificación y formularios.
En este curso, Tácticas Avanzadas de Raspado de Web: Python Playbook, tomarás lo que ya sabes sobre el web scraping introductorio y aprenderás técnicas avanzadas de web scraping.
Primero, aprenderás lo que significa el web scraping avanzado, seguido de cómo manejar el envío de formularios con el módulo de peticiones en Python y Selenio.
A continuación, tratará de cómo manejar los sitios web con páginas de inicio de sesión y cookies, y cómo proporcionar valores de entrada de botones, tales como hacer clic en las casillas de verificación y los botones de radio.
Por último, utilizará el Selenio para cargar archivos que serán útiles cuando los sitios web le pidan que cargue imágenes, archivos pdf y más para seguir adelante. Cuando termines este curso, tendrás la habilidad de navegar por los problemas cuando intentes raspar datos de los sitios web.