La incertidumbre es inevitable en las aplicaciones del mundo real: casi nunca podemos predecir con certeza lo que sucederá en el futuro, e incluso en el presente y el pasado, muchos aspectos importantes del mundo no se observan con certeza. La teoría de la probabilidad nos da la base para modelar nuestras creencias sobre los diferentes estados posibles del mundo, y para actualizar estas creencias a medida que se obtienen nuevas pruebas. Estas creencias pueden combinarse con las preferencias individuales para ayudar a guiar nuestras acciones, e incluso en la selección de las observaciones a realizar. Aunque la teoría de la probabilidad existe desde el siglo XVII, nuestra capacidad para utilizarla eficazmente en grandes problemas que implican muchas variables interrelacionadas es bastante reciente, y se debe en gran medida al desarrollo de un marco conocido como Modelos Gráficos Probabilísticos (MGP). Este marco, que abarca métodos como las redes bayesianas y los campos aleatorios de Markov, utiliza ideas de estructuras de datos discretos en informática para codificar y manipular eficazmente las distribuciones de probabilidad en espacios de altas dimensiones, que a menudo implican cientos o incluso muchos miles de variables. Estos métodos se han utilizado en una enorme gama de ámbitos de aplicación, que incluyen: búsqueda en la web, diagnóstico médico y de fallos, comprensión de imágenes, reconstrucción de redes biológicas, reconocimiento de voz, procesamiento del lenguaje natural, decodificación de mensajes enviados por un canal de comunicación ruidoso, navegación robótica y muchos más. El marco del PGM proporciona una herramienta esencial para cualquiera que quiera aprender a razonar coherentemente a partir de observaciones limitadas y ruidosas.
En esta clase, aprenderá los fundamentos de la representación del PGM y cómo construirlos, utilizando tanto el conocimiento humano como las técnicas de aprendizaje de las máquinas; también aprenderá algoritmos para utilizar un PGM para llegar a conclusiones sobre el mundo a partir de pruebas limitadas y ruidosas, y para tomar buenas decisiones bajo la incertidumbre. La clase cubre tanto los fundamentos teóricos del marco del PGM como las habilidades prácticas necesarias para aplicar estas técnicas a nuevos problemas.
Los temas cubiertos incluyen:
- La red bayesiana y la representación de la red de Markov, incluyendo las extensiones para el razonamiento sobre los dominios que cambian con el tiempo y sobre los dominios con un número variable de entidades
- Métodos de razonamiento e inferencia, incluyendo inferencia exacta (eliminación de variables, árboles de camarillas) e inferencia aproximada (paso de mensajes de propagación de creencias, métodos de la cadena de Markov de Monte Carlo)
- Parámetros de aprendizaje y estructura en los PGM
- Usando un PGM para la toma de decisiones bajo incertidumbre.
Habrá breves pruebas de revisión semanal y asignaciones de programación (Octava/Matlab) centradas en estudios de casos y aplicaciones de los PGM a problemas del mundo real:
- Puntuación y factores de crédito
- Modelización de la herencia genética y la enfermedad
- Redes de Markov y reconocimiento óptico de caracteres (OCR)
- Inferencia: Propagación de creencias
- Cadena de Markov Monte Carlo y Segmentación de Imagen
- Teoría de la decisión: Displasia Arritmogénica del Ventrículo Derecho
- Aprendizaje de campo aleatorio condicional para OCR
- Aprendizaje de estructuras para identificar la estructura del esqueleto
- Reconocimiento de la acción humana con el Kinect
Para prepararse para la clase con antelación, puede considerar la lectura de las siguientes secciones del libro de texto de Daphne y Nir Friedman:
- Introducción y visión general. Capítulos 1, 2.1.1 – 2.1.4, 4.2.1.
- Fundamentos de la Red Bayesiana. Capítulos 3.1 – 3.3.
- Fundamentos de la Red Markov. Capítulos 4.1, 4.2.2, 4.3.1, 4.4, 4.6.1.
- CPDs estructurados. Capítulos 5.1 – 5.5.
- Modelos de plantillas. Capítulos 6.1 – 6.4.1.
Estos serán cubiertos en las dos primeras semanas de la clase en línea.
Las diapositivas para toda la clase se encuentran aquí.