280 likes | 844 Views
Correlación y Regresión lineal. Correlación de Pearson Este coeficiente mide el grado de relación lineal que existe entre dos variables cuantitativas. Al multiplicar el numerador y denominador por 1/n, nos queda:. Si r ≈ 1, entonces las variables están relacionadas en forma directa.
E N D
Correlación y Regresión lineal Ana María Díaz Araya
Correlación de Pearson Este coeficiente mide el grado de relación lineal que existe entre dos variables cuantitativas. Al multiplicar el numerador y denominador por 1/n, nos queda: Ana María Díaz Araya
Si r ≈ 1, entonces las variables están relacionadas en forma directa. Si r ≈ -1, entonces las variables están relacionadas en forma inversa Si r ≈ 0, entonces las variables no están relacionadas en forma lineal Ana María Díaz Araya
El modelo de regresión simple El modelo de regresión lineal simple representa dependencia lineal de una variable respuesta “y” cuantitativa, respecto a otra variable explicativa “x” también cuantitativa. Estructura de los modelos de regresión Se admite que todos los factores o causas que influyen en una variable respuesta, dependiente o endógena (y) pueden dividirse en dos grupos: el primero contiene a la variable (x) llamada variable explicativa, independiente y conocida al observar (y) ; el segundo incluye un conjunto muy grande de factores (variables), los cuales influye en la respuesta en pequeña magnitud, la variables incluidas en el segundo grupo se engloban dentro de un nombre común “error aleatorio (ε)”. Ana María Díaz Araya
La forma del modelo de regresión, es: Yi : Es la variable dependiente Xi : Es la variable independiente β 0 : Es el coeficiente de posición. β1 : Pendiente ξi : Error aleatorio Ana María Díaz Araya
Para estimar los coeficientes de la recta, se emplea el método de ,los mínimos cuadrados, que consiste en minimizar la suma de los errores al cuadrado, es decir: Derivando con respecto de β0 y β1, se forma un sistema de ecuaciones que al resolverlo, nos da que: El parámetro β0 representa el valor medio de y cuando x es cero, β1 representa el incremento que experimenta la media de “y” cuando x aumenta en una unidad. Ana María Díaz Araya
EJEMPLO Una empresa ha reunido información acerca de los gastos generales y las unidades producidas en diferentes plantas con el fin de estimar los gastos generales . Ana María Díaz Araya
1.- Encontrar el coeficiente de correlación 2.- Estimar la ecuación de la recta, en donde la variable independiente es el N° de unidades producidas (X) , y la variable dependiente el gasto (Y). Y = -80,4428571 + 6,4914966 3.- Si se producen 50 unidades, ¿Cuál es el gasto? Ana María Díaz Araya
VARIANZA RESIDUAL Ana María Díaz Araya
INFERENCIA Estime el gasto promedio, si el número de unidades producidas es de 50, Con una confianza de 0,95. Ana María Díaz Araya
Probar si el modelo propuesto es adecuado Ana María Díaz Araya
Ejemplo. Los habitantes de un pueblo están preocupados por el encarecimiento de las viviendas en la zona. El alcalde piensa que los precios de las viviendas están relacionados directamente con el valor de los terrenos. A continuación se indican la venta de 10 casas vendidas y el valor del terreno ( en u.m.) 1.- Confeccione un diagrama de dispersión 2.- Encuentre una medida estadística que le permita ver la relación que el alcalde insinúa. 3.- Encuentre la suma de los errores 4.- Si tiene sentido, encuentre la recta de regresión estimada e interprete la pendiente. Ana María Díaz Araya
1.- 2.- Ana María Díaz Araya
3.- Ana María Díaz Araya
4.- Ana María Díaz Araya
El coeficiente de posición es 19.108. • Es el valor de la casa, cuando el valor del terreno es cero. • La pendiente es 6,8417 u.m. • Indica el incremento del precio promedio de la casa, • cuando el valor del terreno aumenta en 1 u.m. Ana María Díaz Araya
ESTIMACIÓN Si un terreno tiene un precio de 7 u.m. ¿ Cuál es el precio promedio estimado de la casa? Se ha estimado la recta Y = 6,8417 *X + 19,108. Si X = 7 y = 6,8417 * 7 + 19.108 = 66.9999 Ana María Díaz Araya
COEFICIENTE DE DETERMINACIÓN Indica la proporción o porcentaje de la variable Y ( variable dependiente) debe su variación a la variable X ( variable independiente). Es decir nos dice que tanto se ajusta la línea de regresión a los datos Ana María Díaz Araya
En el caso que se utiliza el modelo de regresión lineal simple el coeficiente de determinación, es el cuadrado del coeficiente de correlación. Ejemplo. Interpretación: El 90.6% de la variación es explicada por el modelo. Ana María Díaz Araya