Raspado de la red: Libro de datos de Python

Sección Introducción Transcripciones

Resumen del curso

Hola a todos, mi nombre es Ian Ozsvald, y bienvenidos a mi curso, Web Scraping: El Libro de Jugadas de Datos de Python. Soy un Jefe Interino de Ciencia de Datos dentro de mi consultoría, Mor Consulting, y trabajo con equipos para acelerar su entrega de ciencia de datos. Quieres tomar decisiones con algunos datos. Puedes verlo en una página web, pero no puedes acceder a él, ya que no hay API. Si pudieras acceder a ella, podrías tomar decisiones basadas en datos, podrías aumentar otros conjuntos de datos y podrías contar una historia visual con tus datos para cambiar las opiniones de la gente. En este curso, vamos a raspar una página web estática con BeautifulSoup4, investigar interactivamente los datos raspados, escribir un módulo de raspado fiable, y explorar visualmente las relaciones en los datos que podemos compartir con nuestros colegas. Algunos de los principales temas que cubriremos incluyen el uso de PyCharm para desarrollar, depurar interactivamente y refactorizar nuestro módulo; un eficiente flujo de trabajo para investigar datos de texto, numéricos y categóricos; procesos para identificar valores atípicos y relaciones en nuestro marco de datos de pandas extraídos; la construcción de poderosas explicaciones visuales de nuestros datos utilizando matplotlib y la biblioteca de gráficos estadísticos, Seaborn. Al final de este curso, sabrás cómo escribir un raspador de páginas web estáticas en Python, cómo usar las pruebas de unidad para crear confianza en los datos, cómo explorar interactivamente tus propios datos para explicar las relaciones, y cómo resumir una historia visual para tus colegas. Antes de empezar el curso, deberías estar familiarizado con los fundamentos de la programación en Python. Espero que me acompañes en este viaje para aprender a raspar datos y contar una historia visual con Web Scraping: El Libro de Jugadas de Datos Python, en .