La regresión lineal se utiliza comúnmente para cuantificar la relación entre dos o más variables. También se utiliza para ajustar los factores de confusión. Este curso, que forma parte de nuestro Programa de Certificación Profesional en Ciencias de la Información, cubre cómo implementar la regresión lineal y ajustar por confusión en la práctica usando R.
En las aplicaciones de la ciencia de los datos, es muy común interesarse por la relación entre dos o más variables. El caso de estudio motivador que examinamos en este curso se relaciona con el enfoque basado en datos utilizado para construir equipos de béisbol descrito en Moneyball. Intentaremos determinar qué resultados medidos predicen mejor las carreras de béisbol utilizando la regresión lineal.
También examinaremos la confusión, en la que las variables extrañas afectan a la relación entre dos o más variables, lo que conduce a asociaciones espurias. La regresión lineal es una técnica poderosa para eliminar confusores, pero no es un proceso mágico. Es esencial comprender cuándo es apropiado utilizarla, y este curso le enseñará cuándo aplicar esta técnica.