Descripción
La reducción de la dimensionalidad es una técnica de aprendizaje de máquinas poderosa y versátil que puede utilizarse para mejorar el rendimiento de prácticamente todos los modelos de ML. Utilizando la reducción de dimensionalidad, puede acelerar significativamente el entrenamiento y la validación de los modelos, ahorrando tiempo y dinero, así como reducir en gran medida el riesgo de sobreajuste.
En este curso, Reducir las dimensiones de los datos con scikit-learn, obtendrá la capacidad de diseñar e implementar un conjunto exhaustivo de técnicas de selección de características y reducción de la dimensionalidad en scikit-learn.
Primero, aprenderá la importancia de la reducción de la dimensionalidad, y comprenderá las dificultades de trabajar con datos de dimensionalidad excesivamente alta, a menudo llamada la maldición de la dimensionalidad.
A continuación, descubrirá cómo implementar técnicas de selección de características para decidir qué subconjunto de las características existentes podríamos elegir utilizar, mientras se pierde la menor información posible del conjunto de datos original y completo.
Entonces aprenderá importantes técnicas para reducir la dimensionalidad en los datos lineales. Tales técnicas, en particular el Análisis de Componentes Principales y el Análisis Discriminatorio Lineal, buscan reorientar los datos originales utilizando nuevos ejes optimizados. La elección de estos ejes es impulsada por procedimientos numéricos como el Valor Propio y la Descomposición del Valor Singular.
Luego pasará a tratar con datos múltiples, que no son lineales y a menudo toman la forma de rollos suizos y curvas en S. Estos datos presentan una ilusión de complejidad, pero en realidad se simplifican fácilmente desenrollando el múltiple. Finalmente, explorará cómo implementar una amplia variedad de técnicas de aprendizaje de los múltiples, incluyendo el escalamiento multidimensional (MDS), el isomapa, y la incrustación de vecinos estocástica distribuida en t (t-SNE). Completará el curso comparando los resultados de estas múltiples técnicas de desenrollado con diferentes conjuntos de datos, incluyendo imágenes de rostros y datos escritos a mano.
Cuando termine este curso, tendrá las habilidades y conocimientos de Reducción de la Dimensionalidad necesarios para diseñar e implementar formas de mitigar la maldición de la dimensionalidad en el scikit-learn.