1 / 34

La iniciativa del Programa Acelerado de Datos (PAD) República Dominicana Noviembre, 2011

La iniciativa del Programa Acelerado de Datos (PAD) República Dominicana Noviembre, 2011. Antecedentes. Motivación Programa Acelerado de Datos Fuentes básicas de información estadística

fabian
Download Presentation

La iniciativa del Programa Acelerado de Datos (PAD) República Dominicana Noviembre, 2011

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. La iniciativa del Programa Acelerado de Datos (PAD) República Dominicana Noviembre, 2011

  2. Antecedentes Motivación Programa Acelerado de Datos Fuentes básicas de información estadística • Microdatos fuente importante de indicadores para monitorear estrategias de combate a la pobreza y evaluar efectividad de políticas públicas. • Demanda creciente de investigadores, estudiantes, partidos políticos y medios de comunicación por rendición de cuentas y liberación de datos • Pieza clave para fortalecer los sistemas nacionales y sectoriales de monitoreo y evaluación. SM&E

  3. Antecedentes DIAGNÓSTICO SOBRE LA OFERTA Y DEMANDA DE INFORMACIÓN ESTADÍSTICA EN AMÉRICA LATINA Y EL CARIBE

  4. Antecedentes Algunos problemas y obstáculos • No hay inventarioscompletos y/o actualizados de operacionesestadísticas.. • No hay estándares de calidad en la producción, documentación y diseminación de datos. • Pobre y altamentefragmentadadocumentación de operacionesestadísticas, sin uso de estándares. • No hay políticasformalesdediseminación de datos

  5. QUEJAS FRECUENTES DE USUARIOS: • Visibilidad / “no sabemos lo que ellos tienen” • Accesibilidad / “ellos no quieren compartir los datos” • Confiabilidad / “estos datos son un desorden” • Relevancia / “esto no es realmente lo que necesito” • Uso / “donde esta la documentación?” Pocos usuarios. Baja sastifacción: accesibilidad, confiabilidad, relevancia, comparabilidad. Falta de conexión entre decisores de política y productores estadísticos.

  6. Antecedentes • La Iniciativa del Programa Acelerado de Datos apoya a mejorar la calidad de la Oferta de información estadística a través de la documentación y preservación de los microdatos (inventario, calidad, documentación, preservación) y apoya la Demanda a través de herramientas de diseminación para usuarios.

  7. Plan de Acción Estadístico Marrakech 2004. Cumbre Gestión de Resultados para el Desarrollo: • EstrategiasNacionalespara el Desarrollo Estadístico - países en desarrollo. ENDE. • Ronda preparatoriaCensos 2010. • Desarrollar Red Internacional de Encuestas de HogaresRIEH. • Mejorasurgentesparamonitorear los Objetivos de DesarrollodelMilenio.

  8. ProgramaAcelerado de Datos (PAD) Objetivos y alcance

  9. Programa Acelerado de Datos (PAD) Identifica 3 tareas: TareaNo 1:Documentación, diseminación y preservación de microdatos (estándaresinternacionales DDI y DC) Tarea No 2:Análisis y evaluación de la calidad de los microdatosexistentes (armonización). Tarea No 3:Apoyo en lasactividades de recolección de datos (financiamiento a operacionesestadísticas).

  10. Programa Acelerado de Datos (PAD) Ventajas de la Documentación • Preservación de datos y metadatos (memoria institucional). • Documentación, archivo y diseminación apropiadas de datos promueven su utilización. • Mayor y mejor uso de los datos incrementa su demanda y puede impulsar aumento en el presupuesto para recolección de datos. • Si documentar no es una parte integral de la operación estadística, requiere esfuerzos y recursos adicionales.

  11. Programa Acelerado de Datos (PAD) La mayor parte de la información relevante para documentar se genera en estas etapas del proceso, pero no se captura. Documentación Determinación de objetivos Recolección de información Control de calidad Determinación de la muestra Diseño de la encuesta Diseminación Diseño del cuestionario Capacitación de encuestadores Procesamiento de datos Prueba piloto Usualmente, documentar se considera una etapa ex-post y ajena al proceso de desarrollo de la operación estadística. Algo que “hay que hacer después que todo acaba”.

  12. Programa Acelerado de Datos (PAD) Determinación de objetivos Recolección de información Documentación Control de calidad Determinación de la muestra Diseño de la encuesta Diseminación Diseño del cuestionario Capacitación de encuestadores Procesamiento de datos Prueba piloto Ciclo de gestión de un operativo estadístico La documentación debe ser considerada como etapa integral y simultánea a la operación estadística.

  13. The bean example is taken from: A Manager’s Introduction to Adobe eXtensible Metadata Platform, http://www.adobe.com/products/xmp/pdfs/whitepaper.pdf Programa Acelerado de Datos (PAD) Source: Courtesy of Jostein Ryssevik, Nesstar Inc.

  14. Ventajas • Al documentar durante el ciclo de gestión se detectan y previenen errores de de codificación, se recupera información que de otro modo se perdería. • Mejoran procesos de trabajo y mecanismos de coordinación. • Se reducen tiempos en la publicación • Favorece la comparación • Se promueve la publicación de información, etc.

  15. Iniciativa de Documentación de Datos (IDD) Estándar internacional dedicado a documentar microdatos. Facilita la preservación e intercambio de documentación de bases de datos de las ciencias sociales. Basado en XML para explotar tecnología de Web. Diseñado originalmente por el Consorcio Inter-Universitario para la Investigación Política y Social (ICPSR) –500 miembros Hoy en día manejado por una alianza de instituciones lideres en documentación, preservación y diseminación de datos

  16. Herramientas de Gestión de Microdatos Editor de Metadatos. DOCUMENTACIÓN • Software desarrolladoporel Servicio de DatosNoruegoparalasCienciasSociales • Trabajo de ediciónbasado en los campos del DDI • Permitereciclarmetadatos • Genera archivo en formato.nesstarquecontiene base de datos (transformador de formatos); recursosexternosmanuales, cuestionarios, etc. y metadatos del DDI

  17. Herramientas de Gestión de Microdatos Nesstar Explorer DIFUSIÓN • Es un navegador, es un medio de publicación. No permite edición • Incluye un transformador de formatos a la base de datos, se puede exportar la base de datos en los formatos más comunes dbf, stata, spss, etc.

  18. Herramientas de Gestión de Microdatos Cd Rom Builder DIFUSIÓN • Genera archivos en formato HTLM que pueden publicarse en páginas Web • Genera CDs automáticos • Permite descargar las bases de datos en formatos comunes

  19. Herramientas de Gestión de Microdatos Banco de PreguntasCOMPARABILIDAD • Repositorio de Variables • Incluyedefiniciones, universo, instrucciones al encuestador, códigos de respuesta etc. • Organizacióntemática de las variables

  20. Comparability: Un ejemplo Measuring access to improved water sources in Ghana CWIQ2003 CENSUS 2000 GLSS 1998 DHS 2003

  21. Banco de Preguntas Proposed solution: national question banks (XML repository of re-usable survey metadata)

  22. Herramientas de Gestión de Microdatos Archivo Nacional de datos DIFUSIÓN • Catálogo de operaciones estadísticas documentadas • Motor de búsqueda, permite comparar variables • Integración entre catálogos

  23. Herramientas de Gestión de Microdatos Anonimización DIFUSIÓN • Para difundir microdatos de cualquier operación estadística, se debe preservar la confidencialidad de la información aportada por los informantes • La forma de hacerlo es aplicar las denominadas técnicas de Anonimización.

  24. Herramientas de Gestión de Microdatos DILEMA Cómo mantener una base de microdatos funcional que permita construir indicadores, pero que presente un riesgo muy bajo de re-identificación del informante

  25. Técnicas reconocidas internacionalmente Software paraidentificar el riesgo de re-identificación (libe: Argus/ R, sofwarecomercial) • http://www.tdp.cat/issues/tdp.a004a08.pdf • http://www.statistik.tuwien.ac.at/public/templ/pub06-11.html • http://cran.r-project.org/web/packages/sdcMicro/sdcMicro.pdf • Técnicas de reducción de Datos y Perturbación de Datos

  26. Ejemplo de Violación de Privacidad (a) Microdata (b) Registro Electoral (público)

  27. k-anonymity[Sam01] • QID generalization or suppression • 2-anonymous microdata (b) Voting Registration List (public) [Sam01] P. Samarati, "Protecting Respondent's Privacy in Microdata Release," in IEEE TKDE, vol. 13, n. 6, November/December 2001, pp. 1010-1027.

  28. Agenda en América Latina • Avanzar con la expansión del DDI en los sistemas estadísticos nacionales • ONE´s se encuentran expandiendo el DDI como rectores del SEN • Verificación de la calidad de la documentación

  29. Agenda en América Latina • Avanzar en aspectos relativos a la armonización de preguntas/variables • -Iniciativas relativas a la creación de banco de preguntas y bancos de cuestionarios

  30. Progreso en América Latina • Oficinas Nacionales de Estadística, Ministerios y Nivel Subnacional en 16 paises de la region. Subregional. Oficial en SICA-CENTROESTAT, aprobado por el Comité Andino de Naciones. CAN • Mas de 1,500 operaciones estadísticas documentadas. Portales en línea

  31. Agenda en América Latina • Avanzar con aspectos de diseminación • Técnicas avanzadas para anonimización de microdatos • Políticas y reglamentos para la diseminación de microdatos • Publicación de catálogos ANDA

  32. Agenda en América Latina • Otros Integración del DDI al estándardSDMX utilizado para la transmisión de datos y metadatos (estadística agregada).

  33. DDI Encuestas Anonimización, consistencia De datos, etc. Tabulación, procesado, etc Indicators Raw Data Set Micro-Data Set/ Public Use Files Agregación y armonización de datos Agregación y , Armonización SDMX Aggregate Data Set (Higher Level) Aggregate Data Set (Lower level)

  34. Muchas Gracias

More Related