1 / 21

Correlación y Regresión lineal

Correlación y Regresión lineal. Correlación de Pearson Este coeficiente mide el grado de relación lineal que existe entre dos variables cuantitativas. Al multiplicar el numerador y denominador por 1/n, nos queda:. Si r ≈ 1, entonces las variables están relacionadas en forma directa.

julie-avery
Download Presentation

Correlación y Regresión lineal

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Correlación y Regresión lineal Ana María Díaz Araya

  2. Correlación de Pearson Este coeficiente mide el grado de relación lineal que existe entre dos variables cuantitativas. Al multiplicar el numerador y denominador por 1/n, nos queda: Ana María Díaz Araya

  3. Si r ≈ 1, entonces las variables están relacionadas en forma directa. Si r ≈ -1, entonces las variables están relacionadas en forma inversa Si r ≈ 0, entonces las variables no están relacionadas en forma lineal Ana María Díaz Araya

  4. El modelo de regresión simple El modelo de regresión lineal simple representa dependencia lineal de una variable respuesta “y” cuantitativa, respecto a otra variable explicativa “x” también cuantitativa. Estructura de los modelos de regresión Se admite que todos los factores o causas que influyen en una variable respuesta, dependiente o endógena (y) pueden dividirse en dos grupos: el primero contiene a la variable (x) llamada variable explicativa, independiente y conocida al observar (y) ; el segundo incluye un conjunto muy grande de factores (variables), los cuales influye en la respuesta en pequeña magnitud, la variables incluidas en el segundo grupo se engloban dentro de un nombre común “error aleatorio (ε)”. Ana María Díaz Araya

  5. La forma del modelo de regresión, es: Yi : Es la variable dependiente Xi : Es la variable independiente β 0 : Es el coeficiente de posición. β1 : Pendiente ξi : Error aleatorio Ana María Díaz Araya

  6. Ana María Díaz Araya

  7. Para estimar los coeficientes de la recta, se emplea el método de ,los mínimos cuadrados, que consiste en minimizar la suma de los errores al cuadrado, es decir: Derivando con respecto de β0 y β1, se forma un sistema de ecuaciones que al resolverlo, nos da que: El parámetro β0 representa el valor medio de y cuando x es cero, β1 representa el incremento que experimenta la media de “y” cuando x aumenta en una unidad. Ana María Díaz Araya

  8. EJEMPLO Una empresa ha reunido información acerca de los gastos generales y las unidades producidas en diferentes plantas con el fin de estimar los gastos generales . Ana María Díaz Araya

  9. 1.- Encontrar el coeficiente de correlación 2.- Estimar la ecuación de la recta, en donde la variable independiente es el N° de unidades producidas (X) , y la variable dependiente el gasto (Y). Y = -80,4428571 + 6,4914966 3.- Si se producen 50 unidades, ¿Cuál es el gasto? Ana María Díaz Araya

  10. Ana María Díaz Araya

  11. VARIANZA RESIDUAL Ana María Díaz Araya

  12. INFERENCIA Estime el gasto promedio, si el número de unidades producidas es de 50, Con una confianza de 0,95. Ana María Díaz Araya

  13. Probar si el modelo propuesto es adecuado Ana María Díaz Araya

  14. Ejemplo. Los habitantes de un pueblo están preocupados por el encarecimiento de las viviendas en la zona. El alcalde piensa que los precios de las viviendas están relacionados directamente con el valor de los terrenos. A continuación se indican la venta de 10 casas vendidas y el valor del terreno ( en u.m.) 1.- Confeccione un diagrama de dispersión 2.- Encuentre una medida estadística que le permita ver la relación que el alcalde insinúa. 3.- Encuentre la suma de los errores 4.- Si tiene sentido, encuentre la recta de regresión estimada e interprete la pendiente. Ana María Díaz Araya

  15. 1.- 2.- Ana María Díaz Araya

  16. 3.- Ana María Díaz Araya

  17. 4.- Ana María Díaz Araya

  18. El coeficiente de posición es 19.108. • Es el valor de la casa, cuando el valor del terreno es cero. • La pendiente es 6,8417 u.m. • Indica el incremento del precio promedio de la casa, • cuando el valor del terreno aumenta en 1 u.m. Ana María Díaz Araya

  19. ESTIMACIÓN Si un terreno tiene un precio de 7 u.m. ¿ Cuál es el precio promedio estimado de la casa? Se ha estimado la recta Y = 6,8417 *X + 19,108. Si X = 7 y = 6,8417 * 7 + 19.108 = 66.9999 Ana María Díaz Araya

  20. COEFICIENTE DE DETERMINACIÓN Indica la proporción o porcentaje de la variable Y ( variable dependiente) debe su variación a la variable X ( variable independiente). Es decir nos dice que tanto se ajusta la línea de regresión a los datos Ana María Díaz Araya

  21. En el caso que se utiliza el modelo de regresión lineal simple el coeficiente de determinación, es el cuadrado del coeficiente de correlación. Ejemplo. Interpretación: El 90.6% de la variación es explicada por el modelo. Ana María Díaz Araya

More Related