290 likes | 420 Views
El índice de activos para datos censales: Una aplicación para predecir indicadores educativos en países en desarrollo. Rodrigo Lovatón Dávila , Dorothy Gondwe , Aine Seitz McCarthy, Phatta Kirdruang , and Uttam Sharma. Integrated Public Use Microdata Series- International (IPUMS-I).
E N D
El índice de activos para datos censales: Una aplicación para predecir indicadores educativos en países en desarrollo Rodrigo LovatónDávila, Dorothy Gondwe, Aine Seitz McCarthy, PhattaKirdruang, and Uttam Sharma Integrated Public Use Microdata Series- International (IPUMS-I)
Indice • Motivación • Preguntas de investigación • Revisión de literatura • Datos • Metodología • Resultados • Trabajo en curso
Motivación • Necesidad de una medida de nivel socioeconómico (NSE) para investigación económica y demográfica: • Estimación de pobreza e inequidad. • Como variable de control en análisis de regresión. • Problemas con ingresos y gastos en encuestas de hogares: • Datos costosos de recolectar. • Dificultad para su medición / menor disponibilidad. • Uso de información censal para crear una medida de NSE: • Microdatos censales tienen gran cobertura y son accesibles. • Datos disponibles a través de IPUMS-International. • Aplicación del enfoque basado en activos para crear una medida de NSE.
Preguntas de investigación • ¿Es el índice de activos internamente consistente cuando es aplicado a microdatos censales? • ¿Es el índice de activos una medida válida de nivel socioeconómico (NSE)?
Revisión de literatura • El índice de activos es una buena proxy de ingresos y gasto de consumo (McKenzie, 2005; Sahn y Steifel, 2000). • El índice de activos es confiable en la predicción de indicadores educativos, cuando es comparado con gastos (Filmer y Pritchett, 2001). • Validación del índice examinando indicadores de salud a través de estratos de NSE (Bollen et al., 2002; Filmer y Scott, 2008; Sahn y Stiefel, 2003). • La Encuesta Demográfica y de Salud Familiar (ENDES) usa un índice basado en activos.
Datos • Microdatos censales de IPUMS-International. • Mayor archivo de información gratuita y públicamente accesible de muestras censales: 211 muestras de 68 países, de 1960 a 2010 • Actualmente, no incluye ninguna medida estándar de nivel socioeconómico para el hogar. • Encuesta Demográfica y de Salud Familiar (ENDES)
Metodología: ACP • Supuesto: nivel socioeconómico no observado está reflejado en características de la vivienda, acceso a servicios, y activos. • Recodificación de variables categóricas en binarias y cálculo del índice con Análisis de Componentes Principales (ACP). C1 = b11(X1) + b12(X2) + ... b1p(Xp) • Técnica de reducción de datos que forma un índice a partir de una combinación lineal de todas las variables. • Cada variable recibe un peso asignado en función de su contribución a la variabilidad total de los datos. • Se asigna a cada hogar un índice de acuerdo con la tenencia de dichas variables. • Definición de quintiles basados en el índice de activos.
Metodología • Consistencia interna • Eliminación de variables por etapas (stepwise), cálculo de correlaciones y el alpha de Cronbach. • Comparación gráfica de distribuciones de riqueza con el índice de la ENDES. • Validez • Predicción de indicadores educativos (nivel educativo alcanzado y asistencia a la escuela).
Metodología: Consistencia interna (I) • Eliminación de variables por etapas (stepwise), siguiendo el orden de los pesos del ACP (menor a mayor) y luego el índice es recalculado con las variables restantes. • Cálculo de correlaciones: verificación de consistencia de los rankings luego de la eliminación de cada variable. • Comparación del ranking original de hogares al ranking usando el nuevo grupo de variables. • Alpha de Cronbach: comparación de la consistencia interna entre índices.
Resultados: Consistencia interna (I) Peru 1993 Colombia 2005 • El alpha de Cronbach y las correlaciones calculadas durante el proceso de eliminación de variables muestran que el índice tiene una consistencia interna primero estable o creciente y luego decreciente a partir de cierto punto.
Metodología: Consistencia interna (II) • Comparación gráfica de funciones de densidad kernel entre microdatos censales y ENDES. • Se espera distribuciones similares de NSE, dado que se trata de bases de datos de años similares. • Comparación de estadísticos resumen de distribuciones estandarizadas entre microdatos censales y ENDES. • Percentiles, sesgo, y curtosis.
Resultados: Consistencia interna (II) Senegal 2002 Brasil 2000 • El índice de activos basado en microdatos censales muestra una similar distribución al correspondiente a la ENDES.
Metodología: Validez • Aplicación a indicadores educativos • Comparación de distribuciones de asistencia a la escuela y nivel educativo según quintiles del índice para microdatos censales y ENDES. • Estimación de un modelo probit para asistencia a la escuela, controlando por el índice de activos y otras variables individuales y del hogar: Pr(y=1|X) = Φ(X’β) Donde Pr(y=1|X) es la probabilidad de asistir a la escuela.
Resultados: Validez Modelo probit para asistencia a la escuela usando microdatos censales • Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.
Resultados: Validez Colombia 2005 Perú 1993 • Resultados del modelo probit para asistencia educativa durante el proceso de eliminación de variables. • El efecto marginal del índice de activos y el R2 son estables inicialmente y luego decrecientes.
Discusión de resultados • Procedimiento de eliminación de variables y las distribuciones de densidad de kernel muestran que se trata de una medida consistente de nivel socioeconómico. • El modelo probit indica que el índice de activos tiene un efecto positivo y significativo en la asistencia a la escuela. • La metodología permite determinar estándares para el requerimiento de datos para obtener un índice válido. • El análisis de más muestras de microdatos censales permitirá obtener resultados más concluyentes respecto al grupo de variables esenciales para el índice.
Cuál es el “mejor” método para ACP? • El ACP presentado previamente está basado en variables categóricas recodificadas como binarias (“ACP binario”). • Kolenikovy Angeles (2009) sugieren el uso de variables ordinales, las cuales aportan información adicional a través del orden de las categorías. • Métodos alternativos aplicados a variables ordinales: • “ACP policórico”: ACP basado en correlaciones policóricas. • “ACP ordinal”: ACP basado en la forma “tradicional” para calcular correlaciones pero aplicado a variables ordinales.
Trabajo en curso (1) • Preguntas de investigación: • ¿Son los rankings de hogares basados en métodos alternativos muy diferentes? • ¿Cuál de los métodos para ACP tiene un mejor desempeño para examinar indicadores educativos? (usando quintiles o análisis de regresión)
Trabajo en curso (2) • Metodología: • Tres métodos para ACP: binario, policórico, ordinal. • Cálculo de índices basados en métodos alternativos para 7 muestras de IPUMS-I (incluyendo Cambodia 1998 y Tailandia 2000). • Comparación de los índices usando: • Clasificación de hogares según quintiles. • Comparación gráfica de densidades kernel. • Análisis de regresión para asistencia a la escuela.
Clasificación de hogares por quintiles (Colombia 2005) Resultados preliminares (1) • La clasificación de hogares por quintiles es más similar entre los métodos aplicados a variables ordinales (ACP policórico y ACP ordinal), respecto del ACP binario.
Resultados preliminares (2) Brasil 2000 Colombia 2005 • Las distribuciones kernel para los métodos alternativos muestran similitudes, las cuales son mayores entre los índices aplicados a variables ordinales (forma de la distribución y la concentración de su masa.)
Resultados preliminares (3) Modelo logit para asistencia a la escuela(odd-ratios) • Variables de control: Sexo, edad y edad al cuadrado para el niño; sexo, edad y edad al cuadrado para el jefe del hogar; nivel educativo del jefe del hogar; residencia en área urbana o rural.
Discusión de resultados preliminares • ACP policórico y ordinal tienen mayor concordancia en clasificación de hogares por quintiles que el ACP binario. • Los odds-ratios del modelo logit para asistencia a la escuela muestran un patrón en todas las muestras analizadas: ACP policórico > ACP ordinal > ACP binario • Los resultados preliminares sugieren que el ACP policórico y ordinal tienen un mejor desempeño que el ACP binario como control por nivel socioeconómico. • Siguientes pasos: inclusión de muestras adicionales y desarrollar un procedimiento de eliminación de variables por etapas.