160 likes | 291 Views
M É TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001. INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA. OBJETIVOS
E N D
MÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001 INSTITUTO NACIONAL DE ESTADISTICA REPUBLICA BOLIVARIANA DE VENEZUELA
OBJETIVOS El proceso de imputación y consistencia de datos tiene como objetivo corregir los errores por la mala declaración de respuestas y asignar algún valor válido en aquellas variables que fueron omitidas.
ETAPAS Primera etapa: Pre-validación de los datos, que consiste, en asegurar la consistencia de cada uno de los registros de la base de datos; es decir que cada hogar estuviera asignado a una vivienda familiar, y que cada persona estuviera asignado a un hogar censal o a una colectividad. Adicionalmente, se examinó la validez de algunas variables que por su importancia, no se permitía ausencia de información Segunda etapa: Correspondió a la validación del resto de las variables correspondientes a los registros de vivienda, de hogares y de personas.
MÉ TODOS UTILIZADOS Deductiva Estática: La mayor parte de los algoritmos de asignación se realizaron utilizando este método. Consiste en deducir los valores perdidos de combinaciones de variables no perdidas del mismo caso. Ejemplo: Si no existe información en sexo, pero existe respuesta en “total de hijos e hijas” igual a (00-99) o “ninguno”, asignar “mujer” (2) en sexo. Otro ejemplo, es el siguiente: Si el número de “hijos e hijas nacidos vivos” es menor o igual a edad de la madre menos 11 y menor o igual a 25 aceptar esta información.
´MÉ TODOS UTILIZADOS Imputación Deductiva Dinámica: De acuerdo a los valores de una o más variables se fija un valor que se obtiene de otras variables en el mismo Censo que se actualizan constantemente. Este método también es conocido en la literatura especializada como Hot Desk o Matrices Dinámicas y puede presentar diversas modalidades que varían de acuerdo en la forma en que se ordenan y seleccionan los registros donantes. Ejemplo: “Si es mujer con parentesco código 3 a 9 y tiene declaración de hijos nacidos vivos, asigne por hot deck la edad según la edad de la mujer anterior con igual parentesco e igual número de hijos nacidos vivos”
´ ALGUNOS RESULTADOS % DE CASOS IMPUTADO VARIABLE SEXO 3.68 VARIABLE EDAE 0.56
´ PROPUESTA PARA LA CONSISTENCIA E IMPUTACIÓN DEL CENSO 2010 La importancia de la consistencia e imputación de datos para poder difundir una información censal coherente y consistente; pero sin estar sobrefijada, obliga a que deba revisarse con antelación la metodología empleada para este proceso
´ REVISIÒN DE LA IMPUTACIÓN 2001 Etapa 1: Revisión de las reglas empleadas en la imputación deductiva estática aplicada en el Censo 2001. Revisión de su validez y pertinencia
´ REVISIÓN DE LA IMPUTACIÓN 2001 Etapa 2: Revisión de la imputación deductiva y estática aplicada en el Censo 2001 . Revisión de % de aciertos en la imputación
´ PROPUESTA PARA SELECCIONAR MÉTODOS Y VARIABLES a) Obtener una muestra de la base de datos censales, en la que no exista omisión
´ REVISIÓN DE LA IMPUTACIÓN 2001 b) Simular sobre esta muestra, el patrón de datos perdidos de la base original.
´ REVISIÓN DE LA IMPUTACIÓN 2001 c) Imputar aplicando diferentes técnicas y distintas variables
´ • REVISIÓN DE LA IMPUTACIÓN 2001 • Métodos deductivos • Media / Moda • Hot Deck secuencial • Aleatoria • Regresión • Vecino más cercano • Modelos de series de tiempo
´ REVISIÓN DE LA IMPUTACIÓN 2001 d) Evaluar los resultadas y seleccionar las variables y técnicas de imputación a utilizar.