230 likes | 698 Views
Estimación por Captura y Recaptura. Otoño 2004. En dos etapas. Con listas de individuos. Con varias recapturas. Introducción.
E N D
Estimación por Captura y Recaptura Otoño 2004
En dos etapas. • Con listas de individuos. • Con varias recapturas Introducción • El método de captura y recaptura, índice de Lincoln (1930) o captura con señas o marcas de Petersen (1986), se utiliza para estimar el tamaño de una población. Es una variante de la estimación de cocientes del total de una población y, Puede hacerse:
En la primera etapa: • se capturan 200 peces, • se marcan y se regresan al lago (para que se mezclen con los demás).
Después se extraeunasegunda muestra de 100 peces: • se registra el número de peces marcados que, en este caso son 20.
Usando estimación del cociente del total de una población, tenemos: • n1 : Tamaño de la primera muestra. • n2 : Tamaño de la segunda muestra. • m: Cantidad de peces capturados en la segunda muestra y además están marcados. La estimación está dada por:
Supuestos: • La población que vamos a muestrear no cambia. • Se realiza muestreo aleatorio simple en dos etapas. Queremos estimar la cantidad de peces en un lago ( N ).
Hipótesis Generales • La población es cerrada. N es la misma en cada muestra. • Las muestras se extraen aleatoriamente de la población. • Las muestras son independientes. • Los individuos de la primera muestra se marcan permanentemente con señas de fácil identificación.
TABLAS DE CONTINGENCIA PARA EXPERIMENTOS POR CAPTURA Y RECAPTURA
TABLAS DE CONTINGENCIA PARA EXPERIMENTOS POR CAPTURA Y RECAPTURA
TABLAS DE CONTINGENCIA PARA EXPERIMENTOS POR CAPTURA Y RECAPTURA
Uso de captura y recaptura en listas Cuando las dos muestras son dos listas de individuos. Suponga que queremos estimar la cantidad de estadísticos en los Estados Unidos. • n1 : Cantidad de miembros de ASA (American Statistical Associaton). • n2 : Cantidad de miembros de IMS (Institute for Mathematical Statistics). • m : Cantidad de personas en ambas listas.
Hipótesis de la estimación por captura y recaptura en listas • Población cerrada.- Se cumple más fácilmente, que si fueran animales. • Muestreo aleatorio simple.- Puede ser que subgrupos tengan distinta posibilidad de pertenecer a alguna de las dos organizaciones. • Independencia.- Quizá el pertenecer a ASA dependa de que pertenezca a IMS. • Los individuos pueden no ser identificables (¿J.Smith de la primera lista es Jonquil Smith de la segunda?)
Estimación con varias recapturas • Más de dos muestreos y diferentes tipos de marcaje, aún en el mismo sujeto. • Schnabel (1938), estimó el máximo verosímil de N como: en donde: ni= tamaño de la muestra i; ri = recapturados en la muestra i; Mi= #marcados en la muestra i;
Estimación con varias recapturas • En 1995, Domingo-Salvany, et al , estimaronla frecuencia de adicción al opio en Barcelona, España. • Método de captura y recaptura de 3 listas (K=3) realizadas en 1989: • Adictos al opio de las salas de urgencia, lista E. • Personas que iniciaron tratamiento contra el opioen 1989, del sistema de información sobre uso de drogas en Cataluña, lista T. • Muertos por sobredosis registradas en el forense en 1989, lista D. • Total de 2864 personas distintas en las tres listas.
Estimación con varias recapturas Los datos esperados son:
Modelo log-linealen donde:a es lista E, adictos al opio; b es la lista T, los que están en tratamiento;g es la lista D, los que murieron por sobredosis. • El modelo log-lineal saturado es: Ln mijk= µ+ ai + bj + gk + (ab)ij + (ag)ik +(bg)jk + (abg)ijk • Completa independencia: Ln mijk= µ + ai + bj + gk • Una lista independiente de las otras dos: Ln mijk= µ + ai + bj + gk + (ab)ij; (ag)ik; (bg)jk • Dos muestras son independientes dada la tercera. Ln mijk= µ + ai + bj + gk + (ab)ij + (ag)ik; (ab)ij + (bg)jk.; (ag)ik +(bg)jk. • Todas las interacciones son en dos sentidos: Ln mijk= µ + ai + bj + gk + (ab)ij + (ag)ik +(bg)jk.
Los modelos que se ajustan a la independencia, se usan para estimar ^u (la celda faltante), la cual puede verificarse mediante la prueba de razón de verosimilitud de Cormack G2 y su intervalo de confianza. Donde q1(a) es el percentil de la distribución Xi-cuadrada con área a en la cola derecha, es un intervalo de confianza aproximado del 100*(1-a)% para m22..
Bibliografía: • Lohr, Sharon L. (1999), Muestreo: diseño y análisis, Thomson, México, pp 383-392.
Alumnas: Verónica Gil López Ma. Guadalupe Guadarrama H. Karina Sartillo Lara