Quizás las metodologías de ciencia de datos más populares provienen del aprendizaje de las máquinas. Lo que distingue el aprendizaje automático de otros procesos de decisión guiados por ordenador es que construye algoritmos de predicción utilizando datos. Algunos de los productos más populares que utilizan el aprendizaje automático incluyen los lectores de escritura a mano implementados por el servicio postal, el reconocimiento de voz, los sistemas de recomendación de películas y los detectores de spam.
En este curso, que forma parte de nuestro Programa de Certificación Profesional en Ciencias de la Información, aprenderá algoritmos populares de aprendizaje de máquinas, análisis de componentes principales y regularización mediante la construcción de un sistema de recomendación de películas.
Aprenderá sobre los datos de entrenamiento y cómo utilizar un conjunto de datos para descubrir relaciones potencialmente predictivas. A medida que construyas el sistema de recomendación de películas, aprenderás a entrenar algoritmos usando datos de entrenamiento para que puedas predecir el resultado para futuros conjuntos de datos. También aprenderás sobre el sobreentrenamiento y las técnicas para evitarlo, como la validación cruzada. Todas estas habilidades son fundamentales para el aprendizaje de la máquina.