540 likes | 1.21k Views
Tamaño de Muestra. σ / n. Y 1 , Y 2 , Y 3 , Y 4 ,...Y 100 ,.. ,Y 200 ,...Y 400 ,. TEOREMA CENTRAL DEL LIMITE. Población de elementos a los que se les mide, Y, con media, μ , y desviación σ. Media μ Desviación σ. Frecuencias. Y. Regularidad estadística del primer orden
E N D
σ/ n Y1, Y2, Y3, Y4,...Y100,.. ,Y200,...Y400,... TEOREMA CENTRAL DEL LIMITE Población de elementos a los que se les mide, Y, con media, μ, y desviación σ Media μ Desviación σ Frecuencias Y Regularidad estadística del primer orden (se observa en la naturaleza) Proceso de extracción de muestras al azar, de tamaño n “grande” μ Población teórica (conceptual) de promedios muestrales. Y Regularidad estadística del segundo orden (se construye como inferencia)
TEOREMA CENTRAL DEL LIMITE es el error estándar de la media muestral El error estándar señala el grado de error que se comete al tratar de conocer μ, con la media muestral. Es decir que la media muestral es aproximadamente igual a la media poblacional.
ERROR ESTANDAR DE LA MEDIA MUESTRAL EE(x) La media muestral se acerca más a la media poblacional, mientras más pequeño sea el error estándar. Si el tamaño de muestra crece, disminuye el error estándar y el conocimiento de la media poblacional con la muestral es mas preciso. Otra forma de disminuir el error estándar, es procurando mediante el control de variación, tener más factores constantes (o casi) en la población original.
ERROR ESTANDAR DE LA MEDIA MUESTRAL EE(x) El error estándar depende de un parámetro desconocido que es σ. Entonces, éste se estima con la desviación estándar de la muestra, s. En base a las propiedades del modelo de distribución normal, se construyen los llamados intervalos de confianza para conocer μ, la media poblacional. Estos son:
TAMAÑO DE MUESTRA PARA CONOCER UNA MEDIA POBLACIONAL A partir del intervalo de confianza anterior, si se puede especificar en la etapa de planeación, el error hacia arriba o hacia abajo que se considera máximo aceptable. Es decir, se desea que la diferencia máxima entre el valor por obtenerse de , y el parámetro desconocido. Entonces de la igualdad: se despeja el valor del tamaño de muestra:
TAMAÑO DE MUESTRA PARA CONOCER UNA MEDIA POBLACIONAL Para poder usar la expresión anterior es necesario conocer el valor de σ. Usualmente no se conoce, por lo que se recurre a conocimientos previos sobre poblaciones semejantes, o bien se conduce un estudio piloto para estimar el valor de σ e insertarlo en la fórmula. Por supuesto el estudio piloto también puede servir para ensayar procesos de medición, estimar, costos, etc.
TAMAÑO DE MUESTRA PARA CONOCER UNA MEDIA POBLACIONAL En ocasiones se utiliza la varianza muestral con estudios pilotos, en donde la muestra es pequeña. En esos casos se sustituye la por la s de la muestra, pero se utiliza la distribución t de student con n-1grados de libertad en lugar de la normal estándar Z
TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES En el enunciado del teorema central del límite solo se pide que la población tenga elementos en los que se mide una variable numérica. Entonces se puede considerar el caso de una variable categórica con sólo dos categorías (dicotómica) para hacerla numérica se usa un valor de uno, 1, cuando un elemento tiene la característica A y cero, 0, cuando no. Entonces se puede demostrar que la media de un conjunto de valores cero y uno es igual a la proporción de unos (los identificados con el 1).
TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Así la media muestral Y, es la proporción muestral, p; y la media poblacional, , es la proporción poblacional, P. Además la varianza es igual a P(1-P). Entonces el teorema central de límite señala que si se toman muestras de tamaño n (grande), de una población con valores cero y uno, con proporción poblacional P; entonces los promedios o proporciones muestrales, tendrán una regularidad estadística modelada con la normal.
TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Los parámetros de esta distribución son una media de P y una desviación estándar (error estándar de P) igual a:
P(1-P) n P P-δ P+δ TEOREMA CENTRAL DEL LIMITE PARA PROPORCIONES Población de elementos a los que se mide una variable dicotómica. Con “1” para “ a” y “ 0” si no. 1-P P 0 1 n grande: np>5 y n(1-p)>5 Proceso de extracción de muestras de tamaño n Población teórica de los posibles valores de las proporciones muestrales. Valores de p.
TAMAÑO DE MUESTRA PARA CONOCER UNA PROPORCIÓN POBLACIONAL A partir del intervalo de confianza anterior, si se puede especificar en la etapa de planeación, el error hacia arriba o hacia abajo que se considera máximo aceptable. Es decir, se desea que la diferencia máxima entre el valor por obtenerse de P, y el parámetro desconocido sea Entonces: El tamaño de muestra es:
nmin = 2 3{P(1-P)}2 Tamaño de muestra mínimo para una adecuada cercanía a la normal de la distribución de las p en muchas muestras. Glen McPherson “Statistics in Scientific Investigation. Its Basis, Application, and Interpretation” Springer Verlag, 1990
TEOREMA CENTRAL DEL LIMITE σ n Error estándar de Y Proceso de tomar muchas muestras de tamaño n, y calcular promedios en cada muestra, Y n>0 f (Y) n>10 μ Y n>30 n>30 nP>5 n(1-P)>5 Sólo se toma una muestra, pero se evalúa en relación a la normal 0 1 1 2 3 4 5 μ= P, σ2 = P(1-P)
En todos los casos mencionados, podemos decir, al amparo del Teorema Central del Límite:
Distribución de diferencias de medias de muestras. Consideremos que se toma una muestra de tamaño n1 de una población 1 y otra de tamaño n2 de una población 2. Si ambas muestras son “grandes” o bien la variable de estudio tiene distribucion normal, entonces: Si las varianzas se pueden considerar iguales: Si los tamaños de muestra son iguales:
Dos promedios Homoscedasticidad Regularidad de 2o nivel 1 2 1 2 Proceso de toma de muestras de tamaños n1 y n2 . Se obtiene: f ( x1 -x2) .025 .025 x1-x2 tgle =n1+n2-2
Dos promedios Homoscedasticidad Regularidad de 2o nivel 1 2 1 2 Proceso de toma de muestras de tamaños n1 y n2 . Se obtiene: f ( x1 -x2) .025 .025 x1-x2 tgle =n1+n2-2
Fijos Cambia Cambia Fijos
Etapa de planeación Coeficiente de Variación Diferencia entre medias como % de una media base δ*
Etapa de análisis Capacidad de detección La probabilidad de detectar una diferencia entre medias poblacionales de magnitud o mayor es de 1-
Etapa de análisis Capacidad de detección La probabilidad de detectar una diferencia entre proporciones poblacionales de magnitud o mayor es de 1-
EFECTO DE DISEÑO Kish (1965) propone una expresión para comparar la eficiencia de un diseño muestral complejo con respecto al muestreo aleatorio irrestricto (simple) con el mismo número de elementos:
Utilidad del DEFF • El DEFF tiene al menos dos utilidades muy importantes: • Permite evaluar la eficiencia de un diseño muestral complejo. • Permite ajustar el tamaño de muestra para un diseño de muestreo complejo.
EFECTO DE DISEÑO EN MUESTREO ESTRATIFICADO El muestreo estratificado, por lo general, proporciona mayor precisión, por lo que se espera un DEFF menor a 1; a menos que todas las medias de los estratos sean iguales, en cuyo caso sera igual a 1:
EFECTO DE DISEÑO EN MUESTREO POR CONGLOMERADOS El muestreo por conglomerados de una etapa, cuando todas las unidades primarias tienen M unidades secundarias, es aproximadamente: Donde ICC es el coeficiente de correlación intra-clase, generalmente es positivo, por lo que generalmente es mayor a 1.
Coeficiente de correlación intra-clase (ICC): Componente de varianza entre conglomerados: Componente de varianza dentro de conglomerados:
Tamaño de muestra para muestreo por conglomerados corregido: Si se conoce el efecto de diseño de alguna encuesta similar, es posible corregir el tamaño de la muestra de conglomerados, esto es simplemente:
Tamaño de muestra para muestreo por conglomerados corregido: Si consideramos tanto el número de conglomerados a seleccionar como el número de elementos dentro de conglomerados a seleccionar M, entonces por sustitución tenemos:
Tamaño de muestra para muestreo por conglomerados corregido: Por despeje se tiene , que se evalúa para diferentes valores combinados de n y m dados los demás términos de la ecuación:
Ejemplo.- Cálculo del tamaño de muestra para muestreo por conglomerados corregido:
Representación gráfica de la precisión para diferentes tamaños de muestra de UPM(n) y USM(m): Error máximo permisible () Elementos de muestreo, USM (m) Conglomerados, UPM (n)