320 likes | 510 Views
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DE ESPERANZA DE VIDA. LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA DISCIPLINA DE LAS MATEMÁTICAS APLICADAS EN CONSTANTE DESARROLLO Y EVOLUCIÓN.
E N D
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA LA ESTADÍSTICA APLICADA ES LA REPRESENTACIÓN DE LA REALIDAD CON MODELOS PROBABILÍSTICOS. ES UNA DISCIPLINA DE LAS MATEMÁTICAS APLICADAS EN CONSTANTE DESARROLLO Y EVOLUCIÓN. ¿CÓMO SE CONSTRUYEN LOS MODELOS EN EL CAMPO DE LAS CIENCIAS SOCIALES? TEORÍAS MODELOS DATOS EMPÍRICOS
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA • HIPÓTESIS: SUPUESTO O CONJETURA A PROBAR. • DESCRIPTIVAS • ASOCIATIVAS • DE CAUSA-EFECTO • LAS PRUEBAS DE HIPÓTESIS TIENEN COMO OBJETIVO: • DETERMINAR SI UNA CONJETURA HECHA ACERCA DE ALGUNA CARACTERÍSTICA DE LA POBLACIÓN ESTÁ FIRMEMENTE SUSTENTADA POR LA INFORMACIÓN CONTENIDA EN UNA MUESTRA REPRESENTATIVA DE ESA POBLACIÓN.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA • ANÁLISIS DE REGRESIÓN: • BUSCA ESTABLECER RELACIONES (CAUSALES) ENTRE UNA VARIABLE DEPENDIENTE (Y) Y UN CONJUNTO DE VARIABLES EXPLICATIVAS : { X1, X2,...,Xp-1} • ES UNA TÉCNICA ESTADÍSTICA QUE NOS PERMITE: • -PREDECIR A Y EN TÉRMINOS DE X1, X2,...,Xp-1 • -EXPLICAR LA VARIABILIDAD DE Y EN TÉRMINOS DE X1, X2,...,Xp-1 • CONTROLAR Y EN TÉRMINOS DE VARIABLES EXPLICATIVAS DE CONTROL. • MODELO: • Yi =B0 + B1Xi + ei i = 1,...,n
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA • MODELO: • Yi =B0 + B1Xi + ei i = 1,...,n • Y: VARIABLE DEPENDIENTE (CUANTITATIVA) • X: VARIABLE EXPLICATIVA (CUALQUIER TIPO) • e : ERROR • B0, B1 : PARÁMETROS • SUPUESTOS: • NORMALIDAD (ALEATORIEDAD) • HOMOCEDASTICIDAD • LINEALIDAD
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA HIPÓTESIS: EL PROMEDIO DE ESPERANZA DE VIDA ESTÁ EN FUNCIÓN DE LAS SIGUIENTES OCHO VARIABLES: reg1: Es la indicadora de los Estados que se localizan en la región norte del país. (Baja California, Baja California Sur, Coahuila, Chihuahua, Durango Nuevo León, Sinaloa, Sonora, Tampico y Zacatecas). reg2:Es la indicadora de los Estados que se localizan en la región centro del país. (Aguascalientes, Colima, Distrito Federal, Guanajuato, Hidalgo, Jalisco, México, Michoacán, Morelos, Nayarit, Puebla, Querétaro, San Luis Potosí y Tlaxcala). reg3: Es la indicadora de los Estados que se localizan en la región sur del país. (Veracruz, Chiapas, Oaxaca, Quintana Roo, Yucatán, Guerrero, Campeche y Tabasco).
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA pibe:producto interno bruto de cada uno de los estados a precios de 1993 medido en millones de pesos promesco: promedio en años de la escolaridad de la población de 15 años y más. ingprom: ingreso promedio mensual de preceptores en miles de pesos. pobdh: porcentaje de la población por entidad federativa que es derechohabiente. Es decir la población que se encuentra afiliada a las instituciones de seguridad social. agricult: porcentaje de la población ocupada en el sector primario por entidad federativa. El sector primario comprende las actividades económicas relacionadas con la agricultura, ganaderia, silvicultura,caza y pesca.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA VARIABLE DEPENDIENTE: espvida: número de años que en promedio se espera viva un recién nacido. Ejemplo de datos para Aguascalientes y Baja California respectivamente (fuente: INEGI, 2004):
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA PROCEDIMIENTO: 1.- SE LLEVÓ A CABO UN ANÁLISIS EXPLORATORIO DE TODOS LOS DATOS SIN ENCONTRARSE DATOS FALTANTES O VALORES ATÍPICOS. 2.- SE CALCULO LA MATRIZ DE CORRELACIÓN PARA LOS 32 ESTADOS DELA REPÚBLICA MEXICANA, CON LOS SIGUIENTES RESULTADOS:
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA | espvida reg1 reg2 pibe promesco ingprom pobdh agricult ___________________________________________________________________ espvida | 1.0000 reg1 | 0.4657 1.0000 reg2 | 0.1340 -0.5946 1.0000 pibe | 0.4656 -0.0313 0.2438 1.0000 promesco | 0.8628 0.2904 0.1102 0.6117 1.0000 ingprom | 0.8053 0.6532 -0.2122 0.3476 0.6076 1.0000 pobdh | 0.8305 0.6491 -0.2095 0.2454 0.7582 0.7345 1.0000 agricult | -0.9197 -0.2917 -0.1670 -0.5143 -0.8743 -0.7159 -0.7538 1.0000 ____________________________________________________________________
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA 3.- SELECCIÓN DEL MODELO HACIA ATRÁS (FORWARD ) Primer modelo: todas las 8 variables explicativas: Source | SS df MS Number of obs = 32 -------------+----------------------------------------- F( 7, 24) = 64.80 Model | 17.474195 7 2.49631357 Prob > F = 0.0000 Residual | .924578992 24 .038524125 R-squared = 0.9497 -------------+------------------------------------------ Total | 18.398774 31 .593508838
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] ___________________________________________________________ reg1 | .3028919 .1451065 2.09 0.048 .0034068 .6023771 reg2 | .390707 .0977955 4.00 0.001 .1888671 .5925469 pibe | -.0004662 .0008486 -0.55 0.588 -.0022176 .0012852 promesco | .2154642 .1077838 2.00 0.057 -.0069907 .437919 ingprom | .0001466 .000053 2.77 0.011 .0000372 .000256 pobdh | .0087986 .006398 1.38 0.182 -.0044061 .0220034 agricult | -.0179587 .0065679 -2.73 0.012 -.0315142 -.0044031 cons | 72.21501 .920475 78.45 0.000 70.31524 74.11478 ___________________________________________________________ En esta primer modelo de regresión el pibe tiene el mayor valor p, superior al valor de la significancia establecido de .05 por lo tanto es la primera variable que sale del modelo y volvemos a realizar el análisis de regresión.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA regress espvida reg1 reg2 promesco ingprom pobdh agricult Source | SS df MS Number of obs = 32 -------------+------------------------------------------- F( 6, 25) = 77.72 Model | 17.4625684 6 2.91042806 Prob > F = 0.0000 Residual | .936205597 25 .037448224 R-squared = 0.9491 -------------+------------------------------------------- Total | 18.398774 31 .593508838
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA _____________________________________________________________________ espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+--------------------------------------------------------------------------------------- reg1 | 3088759 .1426623 2.17 0.040 .0150575 .6026943 reg2 | .3876284 .0962617 4.03 0.000 .1893737 .5858832 promesco | .1836927 .0896752 2.05 0.051 -.0009968 .3683822 ingprom | .0001392 .0000505 2.75 0.011 .0000351 .0002433 pobdh | .0100153 .005918 1.69 0.103 -.002173 .0222036 agricult | -.0182367 .0064563 -2.82 0.009 -.0315338 -.0049397 cons | 72.41943 .8300683 87.25 0.000 70.70988 74.12899 ----------------------------------------------------------------------------------------------------- LA SIGUIENTE VARIABLE A ELIMINAR ES pobdh YA QUE NO TIENE EL NIVEL DE SIGNIFICANCIA ESTABLECIDO (.O5). NUEVAMENTE SE REALIZA EL ANÁLISIS DE REGRESIÓN CON LOS SIGUIENTES RESULTADOS:
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA regress espvida reg1 reg2 promesco ingprom agricult Source | SS df MS Number of obs = 32 -------------+----------------------------------------- F( 5, 26) = 86.49 Model | 17.3553143 5 3.47106287 Prob > F = 0.0000 Residual | 1.04345964 26 .040133063 R-squared = 0.9433 -------------+------------------------------------------ Total | 18.398774 31 .593508838
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+----------------------------------------------------------------------------------- reg1 | .4261471 .1290956 3.30 0.003 .1607873 .6915069 reg2 | .372568 .099226 3.75 0.001 .168606 .5765299 promesco | .23679 .0869668 2.72 0.011 .0580271 .4155528 ingprom | .0001383 .0000523 2.64 0.014 .0000308 .0002459 agricult | -.0213731 .0064025 -3.34 0.003 -.0345336 -.0082126 cons | 72.48742 .858302 84.45 0.000 70.72316 74.25169 --------------------------------------------------------------------------------------------------- COMO PODEMOS OBSERVAR TODAS LAS VARIABLES EN ESTE MODELO CUMPLEN CON LA EXIGENCIA DE PRECISIÓN DE TENER UNA SIGNIFICANCIA ESTADÍSTICA PARA LOS VALORES t .05
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA 4.- VALIDACIÓN DEL MODELO FINAL: ANÁLISIS DE RESIDUOS, VALORES ATÍPICOS, OBSERVACIONES INFLUYENTES Y MULTICOLINEALIDAD. 4.1 ANÁLISIS DE RESIDUOS PARA LA NORMALIDAD O ALEATORIEDAD DE LOS RESIDUOS ESTANDARIZADOS SE OBTUVIERON LOS SIGUIENTES RESULTADOS: Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+----------------------------------------------------------------------------- rst | 0.099 0.927 2.97 0.2260
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA Breusch-Pagan / COOKS-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of espvida chi2(1) = 0.16 Prob > chi2 = 0.6879 En este caso vemos que no se rechaza la hipótesis nula, es decir, en este caso no hay problemas de heteroscedasticidad, las varianzas son homogéneas.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA GRÁFICA DE RESIDUOS ESTANDARIZADOS
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA 4.2 ANÁLISIS DE VALORES ATÍPICOS EL CRITERIO DE DETECCIÓN DE ESTOS VALORES ES PARA RESIDUOS ESTANDARIZADOS (rst) MAYORES A 2.5 QUE EN TÉRMINOS DE PROBABILIDAD ES DE .9876 COMO SE VIÓ EN LA GRÁFICA ANTERIOR HAY UNA OBSERVACIÓN ATÍPICA QUE CORRESPONDE AL ESTADO DE QUERÉTARO. 4.3 ANÁLISIS DE OBSERVACIONES INFLUYENTES. EMPLEANDO EL ESTADÍSTICO DE DISTANCIAS DE COOKS Di 4/n Di Fp.n-p(0.95) Y CON LAS GRÁFICAS RESPECTIVAS ES POSIBLE IDENTIFICAR CASOS CON VALORES ALTOS. NUEVAMENTE ES EL ESTADO DE QUERÉTARO UNA OBSERVACIÓN INFLUYENTE AL IGUAL QUE TAMAULIPAS.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA 4.4 MULTICOLINEALIDAD. SE PRESENTA CUANDO LOS BiESTÁN CORRELACIONADOS. EL ESTADÍSTICO DE PRUEBA SE LLAMA FACTOR DE INFLACIÓN DE LA VARIANZA (VIF). SI VIF 10 HAY PROBLEMAS DE MULTICOLINEALIDAD. Variable | VIF ----------------+------------- agricult | 6.56 promesco | 4.36 ingprom | 3.77 reg1 | 2.85 reg2 | 1.93 -------------+---------------------- Mean VIF | 3.89 No existen problemas de multicolinealidad.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA MODELO ALTERNATIVO FINAL EN ESTE MODELO SE HAN ELIMINADO A LOS ESTADOS DE TAMAULIPAS Y QUERÉRATO. LOS RESULTADOS SON LOS SIGUIENTES: Source | SS df MS Number of obs = 30 -------------+----------------------------------------- F( 5, 24) = 123.36 Model | 17.5556093 5 3.51112187 Prob > F = 0.0000 Residual | .683080975 24 .028461707 R-squared = 0.9625 -------------+-------------------------------------------- Total | 18.2386903 29 .628920355
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA ------------------------------------------------------------------------------------------------------------- espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+------------------------------------------------------------------------------------ reg1 | .4315045 .1129538 3.82 0.001 .1983793 .6646297 reg2 | .3890436 .084346 4.61 0.000 .214962 .5631252 promesco | .2115511 .0739807 2.86 0.009 .0588625 .3642398 ingprom | .0001427 .000046 3.10 0.005 .0000478 .0002375 agricult | -.0238405 .0055735 -4.28 0.000 -.0353437 -.0123372 _cons | 72.73745 .7398237 98.32 0.000 71.21052 74.26437 TODAS LAS SIGNIFICANCIAS PARA LOSVALORES DE t SON MENORES AL .05 PASEMOS A LA EVALUACIÓN DE ESTE MODELO.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA ANÁLISIS DE RESIDUOS: 1.- LOS RESIDUOS ESTÁN NORMALMENTE DISTRIBUIDOS. EL VALOR DE 2 = 2.73 Y UN VALO DE p = .2549 NO SE RECHAZA LA Ho. 2.-PARA LA HOMOSCEDASTICIDAD, EL RESULTADO DE LA PRUEBA FUE: Breusch-Pagan / COOKS-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of espvida chi2(1) = 2.61 Prob > chi2 = 0.1065 NO SE RECHAZA LA Ho, ES DECIR, NO HAY PROBLEMAS DE HETEROSCEDASTICIDAD
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA 3.- VALORES ATÍPICOS: NO HAY NINGUNA OBSERVACIÓN MAYOR A 2.5 4.- OBSERVACIONES INFLUYENTES. AL APLICAR EL ESTADÍSTICO DE COOKS LOS ESTADOS DE CHIAPAS Y EL DISTRITO FEDERAL RESULTARON CON PROBLEMAS. 5.- MULTICOLINEALIDAD. NO SE TUVO PROBLEMAS. Variable | VIF 1/VIF -------------+---------------------- agricult | 6.67 0.150000 TODOS LOS VALORES TIENEN UN FACTOR promesco | 4.36 0.229342 DE INFLACIÓN DE LAVARIANZA (VIF) 10 ingprom | 3.98 0.251341 reg1 | 2.82 0.354094 reg2 | 1.84 0.543076 -------------+---------------------- Mean VIF | 3.93
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA ANÁLISIS DE LA DECISIÓN FINAL: Al eliminar a Chiapas y el Distrito Federal, hacer el modelo y validarlo nuevamente tenemos observaciones influyentes, estamos perdiendo información y con ello el valor de R2 disminuye. Por ello se tomó la decisión de crear dos variables indicadoras para las observaciones influyentes de Querétaro y Tamaulipas y volver a obtener el modelo de regresión con los siguientes resultados: Source | SS df MS Number of obs = 32 -------------+------------------------------ F( 7, 24) = 88.92 Model | 17.715693 7 2.53081329 Prob > F = 0.0000 Residual | .683080975 24 .028461707 R-squared = 0.9629 -------------+------------------------------ Total | 18.398774 31 .593508838
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+-------------------------------------------------------------------------------- reg1 | .4315045 .1129538 3.82 0.001 .1983793 .6646297 reg2 | .3890436 .084346 4.61 0.000 .214962 .5631252 indquere | -.5290672 .1792217 -2.95 0.007 -.8989625 -.1591718 indtamau | -.355178 .1849542 -1.92 0.067 -.7369047 .0265488 promesco | .2115511 .0739807 2.86 0.009 .0588625 .3642398 ingprom | .0001427 .000046 3.10 0.005 .0000478 .0002375 agricult | -.0238405 .0055735 -4.28 0.000 -.0353437 -.0123372 _cons | 72.73745 .7398237 98.32 0.000 71.21052 74.26437 -------------------------------------------------------------------------------------------------- La indicadora Tamaulipas (indtamau) esta a más del 5% por ello debemos regresarla a su región de origen y nos queda la siguiente regresión FINAL.
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA Source | SS df MS Number of obs = 32 -------------+--------------------------------------------- F( 6, 25) = 93.11 Model | 17.6107329 6 2.93512215 Prob > F = 0.0000 Residual | .788041099 25 .031521644 R-squared = 0.9572 -------------+---------------------------------------------- Total | 18.398774 31 .593508838 --------------------------------------------------------------------------------------------- espvida | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+--------------------------------------------------------------------------------- reg1 | .3804491 .115531 3.29 0.003 .1425086 .6183897 reg2 | .4012269 .0885129 4.53 0.000 .2189312 .5835225 indquere | -.5367571 .1885628 -2.85 0.009 -.9251095 -.1484048 promesco | .2313325 .0770977 3.00 0.006 .0725469 .3901181 ingprom | .0001624 .0000471 3.45 0.002 .0000653 .0002595 agricult | -.0211333 .0056748 -3.72 0.001 -.0328208 -.0094459 _cons | 72.43623 .7608776 95.20 0.000 70.86917 74.00328
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA LA ECUACIÓN AJUSTADA DEL MODELO FINAL SIN ELIMINAR A NINGÚN ESTADO Y CREANDO LA INDICADORA DE QUERÉTARO ES LA SIGUIENTE: PROMEDIO DE ESPERANZA DE VIDA= 72.43+ .38044reg1+ .40122 reg2+.231332promesco+.0001624ingprom -.021133agricult -.5367indquere La interpretación es la SIGUIENTE: LA ESPERANZA DE VIDA EMPIEZA CON UNA BASE DE 72.43 AÑOS PARA LOS ESTADOS DEL SUR, SI PERTENECE A LOS ESTADOS DEL NORTE SE LE AGREGA .38044 AÑOS Y SI SE PERTENECE AL CENTRO SE LE SUMA .40122 AÑOS. PARA CUALQUIER ESTADO POR CADA AÑO MÁS DE ESTUDIO SE LE AGREGA A LA ESPERANZA DE VIDA .231333 DE AÑOS. POR CADA 1000 PESOS DE AUMENTO EN EL INGRESO MENSUAL SE LE SUMA .0001624 Y FINALMENTE POR CADA PUNTO PORCENTUAL QUE AUMENTE LA POBLACIÓN DEDICADA A LAS ACTIVIDADES PRIMARIAS LA ESPERANZA DE VIDA DISMINUYE EN .021133. NOTASI ESTAMOS REALIZANDO EL ANÁLISIS PARA QUERÉTARO SE LE DEBE RESTAR .5367 AL PROMEDIO DE LA ESPERANZA DE VIDA..
ECUACIÓN DE PREDICCIÓN DEL PROMEDIO DEESPERANZA DE VIDA Del análisis empírico de los datos para el año 2004 podemos obtener como conclusiones que el promedio de esperanza de vida es mayor en el los Estados de Norte del país a diferencia de los Estados del Sur, sin embargo, la diferencia es en general de 1.5 años más, sin embargo dentro de los Estados del Sur encontramos Estados como Chiapas que tienen dos años menos de vida con respecto a la media de los Del Norte. Así mismo los datos también nos sirvieron para ver los niveles de educación que son mucho más altos en el Norte con un promedio de 8 años de estudio para personas de 15 años en adelante aunque por ejemplo el Distrito Federal tiene 10 años de estudio mientras que el de menos valor de la República Mexicana es Chiapas con 5.8 años. Con respecto al ingreso el Norte es el de más altos ingresos siendo el estado de Baja California el mayor con 8328 pesos y el menor Chiapas con 2773. Finalmente en el Sur es donde hay más población dedicada a las actividades del sector primario siendo Oaxaca en donde casi el 60% de la población se dedicada a este tipo de actividades y el que menos es Baja California (dedicada al turismo). Llama la atención que el producto interno bruto de cada Estado no hay servido para explicar la esperanza de vida, la teoría nos dice lo contrario, a mayor PIB mejor calidad de vida y con ello el aumento en la esperanza de vida. Otra variable fue el porcentaje de la población derechohabiente, la atención a la salud está relacionada con los años de vida.