550 likes | 929 Views
Estadística Descriptiva: 4. Correlación y Regresión Lineal. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis:
E N D
Estadística Descriptiva:4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María
Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. • Tipos de Análisis: • Describir cómo se comporta una variable • Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) • Describir cómo interaccionan varias variables Estadística DescriptivaObjetivo
Correlación:Medida cuantitativa del grado de asociación entre dos variables X e Y continuas • Idea: Si X e Y están correlacionadas un cambio en X se corresponde con un cambio en Yy viceversa. • Si un incremento en X genera un incremento en Y diremos que las variables están correlacionadas positivamente. En caso contrario diremos que están correlacionadas negativamente. Estadística DescriptivaCorrelación en Análisis Bivariado
Ejemplo: Columna del New York Times Estadística DescriptivaCorrelación en Análisis Bivariado
Covarianza: La idea es medir los cambios con respecto al nivel medio de cada variable • Claramente generaliza la varianza: cov(x,x) • Problema: la medida depende de las magnitudes absolutas de x e y. Una mayor covarianza no significa mayor asociación Estadística DescriptivaCorrelación en Análisis Bivariado
Coeficiente de Correlación de Pearson: La idea es normalizar la covarianza con una medida de dispersión para X y para Y • Medida acotada entre -1 y 1 (probarlo! se sigue de la desigualdad de Cauchy-Schwarz para productos puntos) Estadística DescriptivaCorrelación en Análisis Bivariado
Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado
Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado
Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado
Correlación positiva (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado
Correlación negativa (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado
Correlación nula (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado
Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado
Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado
Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado
Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado
Modelo de una variable y como función de otra x • x se denomina la variable independiente • y se denomina la variable dependiente • εes el residuo, la parte que no logra ser explicada por el modelo (f será usualmente una función determinista) Estadística DescriptivaRegresión
Modelo de una variable y como función de otra x • A partir de una muestra de valores de x e y, queremos encontrar un modelo apropiado. • Qué tipo de función f utilizar? • Cómo seleccionar un modelo adecuado en base a la muestra de observaciones? Estadística DescriptivaRegresión
¿Qué función f utilizar?: Una función periódica? Estadística DescriptivaRegresión
¿Qué función f utilizar? • un polinomio? Estadística DescriptivaRegresión
¿Qué función f utilizar? • una exponencial? Estadística DescriptivaRegresión
¿Qué función f utilizar? • una logística? Estadística DescriptivaRegresión
Graficar la muestra de valores (x,y) y estudiar la forma de la posible relación Estadística DescriptivaRegresión
Una alternativa simple consiste en modelar y como función lineal de x, es decir Estadística DescriptivaRegresión Lineal
Una alternativa simple consiste en modelar y como función lineal de x, es decir Estadística DescriptivaRegresión Lineal
¿Qué parámetros b0 y b1 son apropiados para modelar la relación entre x e y? • Supongamos que hemos conseguido una muestra de n pares de valores x e y: Estadística DescriptivaRegresión Lineal
Ejemplo: Estadística DescriptivaRegresión Lineal ¿El financiamiento entregado a la autoridad Palestina contribuye a mitigar el conflicto en la región?
Variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Muestra: Si medimos x e y en • los últimos años tenemos: Estadística DescriptivaRegresión Lineal
Graficando X versus Y Estadística DescriptivaRegresión Lineal
Graficando X e Y en cada año Estadística DescriptivaRegresión Lineal
Variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Modelo: Postulamos un modelo lineal Estadística DescriptivaRegresión Lineal
Ajustar el modelo lineal consiste en buscar parámetros b0 y b1 que hagan el modelo adecuado • Cada combinación de parámetros genera una predicción para el valor de y asociado a x Estadística DescriptivaRegresión Lineal
b0 = 10 y b1 = 1 Estadística DescriptivaRegresión Lineal
b0 = 50 y b1 = 0.5 Estadística DescriptivaRegresión Lineal
b0 = 50 y b1 = 0.75 Estadística DescriptivaRegresión Lineal
Lo que necesitamos es definir una función de error y encontrar los parámetros b0 y b1 que la minimizan • Propuesta: minimizar error cuadrático, Estadística DescriptivaRegresión Lineal
Dada la muestra de observaciones buscamos el modelo que minimiza el error promedio Estadística DescriptivaRegresión Lineal
Si los paramétros b0 y b1 minimizan • Se debe verificar Estadística DescriptivaRegresión Lineal
Ecuaciones normales: derivando Estadística DescriptivaRegresión Lineal
Ecuaciones normales: reordenando y dividiendo por n Estadística DescriptivaRegresión Lineal
Despejando b0 en la primera y reemplazando en la segunda Estadística DescriptivaRegresión Lineal
Estimadores de Mínimos Cuadrados del Modelo Lineal para Y en función de X Estadística DescriptivaRegresión Lineal
En nuestro ejemplo anterior, variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Muestra Estadística DescriptivaRegresión Lineal
Calculamos la varianza de la variable predictora y la covarianza entre las variables x e y Estadística DescriptivaRegresión Lineal
Tenemos entonces que Estadística DescriptivaRegresión Lineal
Predicciones de nuestro modelo Estadística DescriptivaRegresión Lineal
Predicciones de nuestro modelo (magenta) Estadística DescriptivaRegresión Lineal
¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad total de Y variabilidad explicada por el modelo variabilidad NO explicada por el modelo
¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad explicada por el modelo
¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad total de Y variabilidad explicada por el modelo variabilidad NO explicada por el modelo