1 / 55

Estadística Descriptiva: 4. Correlación y Regresión Lineal

Estadística Descriptiva: 4. Correlación y Regresión Lineal. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis:

Download Presentation

Estadística Descriptiva: 4. Correlación y Regresión Lineal

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estadística Descriptiva:4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

  2. Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. • Tipos de Análisis: • Describir cómo se comporta una variable • Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) • Describir cómo interaccionan varias variables Estadística DescriptivaObjetivo

  3. Correlación:Medida cuantitativa del grado de asociación entre dos variables X e Y continuas • Idea: Si X e Y están correlacionadas un cambio en X se corresponde con un cambio en Yy viceversa. • Si un incremento en X genera un incremento en Y diremos que las variables están correlacionadas positivamente. En caso contrario diremos que están correlacionadas negativamente. Estadística DescriptivaCorrelación en Análisis Bivariado

  4. Ejemplo: Columna del New York Times Estadística DescriptivaCorrelación en Análisis Bivariado

  5. Covarianza: La idea es medir los cambios con respecto al nivel medio de cada variable • Claramente generaliza la varianza: cov(x,x) • Problema: la medida depende de las magnitudes absolutas de x e y. Una mayor covarianza no significa mayor asociación Estadística DescriptivaCorrelación en Análisis Bivariado

  6. Coeficiente de Correlación de Pearson: La idea es normalizar la covarianza con una medida de dispersión para X y para Y • Medida acotada entre -1 y 1 (probarlo! se sigue de la desigualdad de Cauchy-Schwarz para productos puntos) Estadística DescriptivaCorrelación en Análisis Bivariado

  7. Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado

  8. Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado

  9. Observación: Si x e y tienen una relación lineal exacta • la correlación de Pearson es igual al signo • de a Estadística DescriptivaCorrelación en Análisis Bivariado

  10. Correlación positiva (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado

  11. Correlación negativa (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado

  12. Correlación nula (Pearson) Estadística DescriptivaCorrelación en Análisis Bivariado

  13. Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado

  14. Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado

  15. Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado

  16. Limitaciones del Coeficiente de Pearson Estadística DescriptivaCorrelación en Análisis Bivariado

  17. Modelo de una variable y como función de otra x • x se denomina la variable independiente • y se denomina la variable dependiente • εes el residuo, la parte que no logra ser explicada por el modelo (f será usualmente una función determinista) Estadística DescriptivaRegresión

  18. Modelo de una variable y como función de otra x • A partir de una muestra de valores de x e y, queremos encontrar un modelo apropiado. • Qué tipo de función f utilizar? • Cómo seleccionar un modelo adecuado en base a la muestra de observaciones? Estadística DescriptivaRegresión

  19. ¿Qué función f utilizar?: Una función periódica? Estadística DescriptivaRegresión

  20. ¿Qué función f utilizar? • un polinomio? Estadística DescriptivaRegresión

  21. ¿Qué función f utilizar? • una exponencial? Estadística DescriptivaRegresión

  22. ¿Qué función f utilizar? • una logística? Estadística DescriptivaRegresión

  23. Graficar la muestra de valores (x,y) y estudiar la forma de la posible relación Estadística DescriptivaRegresión

  24. Una alternativa simple consiste en modelar y como función lineal de x, es decir Estadística DescriptivaRegresión Lineal

  25. Una alternativa simple consiste en modelar y como función lineal de x, es decir Estadística DescriptivaRegresión Lineal

  26. ¿Qué parámetros b0 y b1 son apropiados para modelar la relación entre x e y? • Supongamos que hemos conseguido una muestra de n pares de valores x e y: Estadística DescriptivaRegresión Lineal

  27. Ejemplo: Estadística DescriptivaRegresión Lineal ¿El financiamiento entregado a la autoridad Palestina contribuye a mitigar el conflicto en la región?

  28. Variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Muestra: Si medimos x e y en • los últimos años tenemos: Estadística DescriptivaRegresión Lineal

  29. Graficando X versus Y Estadística DescriptivaRegresión Lineal

  30. Graficando X e Y en cada año Estadística DescriptivaRegresión Lineal

  31. Variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Modelo: Postulamos un modelo lineal Estadística DescriptivaRegresión Lineal

  32. Ajustar el modelo lineal consiste en buscar parámetros b0 y b1 que hagan el modelo adecuado • Cada combinación de parámetros genera una predicción para el valor de y asociado a x Estadística DescriptivaRegresión Lineal

  33. b0 = 10 y b1 = 1 Estadística DescriptivaRegresión Lineal

  34. b0 = 50 y b1 = 0.5 Estadística DescriptivaRegresión Lineal

  35. b0 = 50 y b1 = 0.75 Estadística DescriptivaRegresión Lineal

  36. Lo que necesitamos es definir una función de error y encontrar los parámetros b0 y b1 que la minimizan • Propuesta: minimizar error cuadrático, Estadística DescriptivaRegresión Lineal

  37. Dada la muestra de observaciones buscamos el modelo que minimiza el error promedio Estadística DescriptivaRegresión Lineal

  38. Si los paramétros b0 y b1 minimizan • Se debe verificar Estadística DescriptivaRegresión Lineal

  39. Ecuaciones normales: derivando Estadística DescriptivaRegresión Lineal

  40. Ecuaciones normales: reordenando y dividiendo por n Estadística DescriptivaRegresión Lineal

  41. Despejando b0 en la primera y reemplazando en la segunda Estadística DescriptivaRegresión Lineal

  42. Estimadores de Mínimos Cuadrados del Modelo Lineal para Y en función de X Estadística DescriptivaRegresión Lineal

  43. En nuestro ejemplo anterior, variables: • X: financiamiento entregado a la autoridad palestina. • Y: número de homicidios el año siguiente. • Muestra Estadística DescriptivaRegresión Lineal

  44. Calculamos la varianza de la variable predictora y la covarianza entre las variables x e y Estadística DescriptivaRegresión Lineal

  45. Tenemos entonces que Estadística DescriptivaRegresión Lineal

  46. Predicciones de nuestro modelo Estadística DescriptivaRegresión Lineal

  47. Predicciones de nuestro modelo (magenta) Estadística DescriptivaRegresión Lineal

  48. ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad total de Y variabilidad explicada por el modelo variabilidad NO explicada por el modelo

  49. ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad explicada por el modelo

  50. ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. Estadística DescriptivaRegresión Lineal variabilidad total de Y variabilidad explicada por el modelo variabilidad NO explicada por el modelo

More Related