170 likes | 542 Views
Análisis de regresión con dos variables: Algunas ideas básicas. La regresión bivariable o con dos variables, en el cual la variable dependiente (la regresada) se relaciona con una sola variable explicativa (la regresora).
E N D
Análisis de regresión con dos variables: Algunas ideas básicas La regresión bivariable o con dos variables, en el cual la variable dependiente (la regresada) se relaciona con una sola variable explicativa (la regresora). El análisis de regresión se relaciona en gran medida con la estimación o predicción de la media (de la población) o valor medio de la variable dependiente, con base en los valores conocidos o fijos de las variables explicativas. Consideremos un ejemplo. Los datos que se va dar se refiere a la población total de 60 familias de una comunidad hipotética, así como su ingreso semanal (X) y su gasto de consumo semanal (Y) en soles. Las familias se dividen en 10 grupos de ingresos (de 80 soles a 260 soles); así mismo, aparecen los gastos semanales de cada familia de los diversos grupos. Por consiguiente, hay 10 valores fijos de X y los correspondientes valores Y para cada valor X; así, hay 10 subpoblaciones Y
100 X 80 120 140 160 180 200 220 260 240 Y 65 55 79 80 102 110 120 135 150 137 70 60 84 93 107 115 136 137 152 145 74 65 90 95 110 120 140 140 175 155 80 70 94 103 116 130 144 152 178 165 85 75 98 108 118 135 145 157 180 175 88 - - 113 125 140 - 160 185 189 - - - 115 - - - 162 191 - 462 325 445 707 678 750 685 1043 1211 966 77 65 89 101 113 125 137 149 173 161 En total hay 10 valores se les llama valores esperados condicionales
El valor esperado incondicional del consumo semanal, E(Y). Si sumamos los consumos semanales de las 60 familias que forma la población y dividimos este numero entre 60, obtendremos la cantidad de 121.20 soles (7272/60), que el valor de la media incondicional, o esperada, del consumo E(Y); es incondicional porque, para obtener esta cifra, obviamos los niveles de ingreso de las diversas familias. 200 Consumo semanal 150 100 50 100 120 140 160 180 220 240 260 80 200 Ingreso semanal
100 X 80 120 140 160 180 200 220 260 240 Y 1/6 1/5 1/5 1/7 1/6 1/6 1/5 1/7 1/7 1/6 1/6 1/5 1/5 1/7 1/6 1/6 1/5 1/7 1/7 1/6 1/6 1/5 1/5 1/7 1/6 1/6 1/5 1/7 1/7 1/6 1/6 1/5 1/5 1/7 1/6 1/6 1/5 1/7 1/7 1/6 1/6 1/5 1/5 1/7 1/6 1/6 1/5 1/7 1/7 1/6 1/6 - - 1/7 1/6 1/6 - 1/7 1/7 1/6 - - - 1/7 - - - 1/7 1/7 - 77 65 89 101 113 125 137 149 173 161 ¿Cuál es el valor esperado del consumo semanal de una familia? La respuesta es 121.20 soles (la media incondicional). Pero si se pregunta ¿Cuál es el valor esperado del consumo semanal de una familia cuyo ingreso mensual es de 140 soles? La respuesta es 101 (la media condicional).
Los puntos medios dentro de los círculos muestran los valores medios condicionales de Y, graficados en función de los diferentes valores de X. Al unir estos valores obtenemos la línea de regresión poblacional (LRP) o mas general, la curva de regresión poblacional (CRP). O en otras palabras mas sencillas, es la regresión de Y sobre X. Así desde el punto de vista geométrico, una curva de regresión poblacional es tan solo el lugar geométrico de las medias condicionales de la variable dependiente par los valores fijos de las variables explicativas.
Y Media condicional E(Y/X) 149 Distribución de Y dada X = 220 Consumo semanal 101 65 50 X 140 220 80 Ingreso semanal
Concepto de función de regresión poblacional (FRP) De la anterior exposición, es claro que cada media condicional E(Y/X) es función de Xi, donde Xi es un valor dado de X. simbólicamente. E(Y/Xi) = f/Xi) ¿Qué forma adopta la función f(Xi)? Esta pregunta es importante porque en una situación real no disponemos de toda la población par efectuar el análisis. La forma funcional de la FRP es por consiguiente una pregunta empírica. E(Y/Xi) = β1 + β2Xi Donde β1 y β2 son parámetros no conocidos pero fijos que se denomina coeficientes de regresión; también como coeficientes de intercepción y de pendiente, respectivamente
Significado del termino lineal.- Se interpreta de dos formas: 1.- Linealidad en las variables.- El significado mas “natural”, de linealidad es aquel que la esperanza condicional de Y es una función lineal de Xi, geométricamente l curva de regresión en este caso es una recta. En esta interpretación, una función de regresión como E(Y/Xi) = β1 + β2X2, no es una función lineal porque la variable X aparece elevada a una potencia o índice de 2 2.- Linealidad en los parámetros.-La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, E(Y/Xi), es una función lineal de parámetros, los β; puede ser o no lineal en la variable X. De acuerdo con esta interpretación, E(Y/Xi) = β1 + β2X2 es un modelos de regresión lineal. De las dos interpretaciones de linealidad, la linealidad en los parámetros es pertinente para el desarrollo de la teoría.
Y Y Exponencial Cuadrática Y = eβ1 + β2X Y = β1 + β2X + β3X2 0 0 X X Y Cubica Y = β1 + β2X + β3X2 + β4X3 MRL = modelo de regresión lineal MRNL = modelo de regresión no lineal 0 X
Es claro que, a medida que aumenta el ingreso familiar, el consumo familiar, en promedio, también aumenta. Se ve que, con el nivel de ingreso de X, el consumo de una familia en particular se agrupa alrededor del consumo promedio de todas las familias ese nivel de Xi, alrededor de su esperanza condicional Especificación estocástica de la FRP Por consiguiente, expresamos la desviación de un Yi. υi = Yi – E(Y/Xi) Yi = E(Y/Xi) + υi Donde la desviación υi es una variable aleatoria no observable que adopta valores positivos o negativos. Técnicamente, υi se conoce como perturbación estocástica o términos de error estocástico. Se puede decir que el gasto de una familia en particular, según su nivel de ingreso, se expresa como la suma de dos componentes: