250 likes | 408 Views
El promedio como variable aleatoria: error estándar e intervalo de confianza para la media de la muestra. Mario Briones L. MV, MSc 2005. x. Estimador puntual. El descriptor de tendencia central que es la media aritmética o promedio, ocupa una posición puntual sobre la recta numérica.
E N D
El promedio como variable aleatoria: error estándar e intervalo de confianza para la media de la muestra Mario Briones L. MV, MSc 2005
x Estimador puntual • El descriptor de tendencia central que es lamedia aritmética o promedio, ocupa unaposición puntual sobre la recta numérica
El promedio como variable aleatoria • Si una muestra bien tomada sobre una población dada ha generado un promedio • Una segunda muestra generará “probablemente” un promedio nuevo, diferente del anterior • PREGUNTA: alguno de los promedios es incorrecto?
El promedio como variable aleatoria • Esto significa que cada vez que se toma una muestra de tamaño n, el promedio obtenido puede considerarse como una observación perteneciente a una población con una distribución • Esta distribución tiene media m y varianza s2/n
El error estándar de la media • La dispersión de la media muestreal para un tamaño n, fluctua alrededor de m con una desviación estándar igual a s/n • Si la muestra es grande, la distribución de la media muestreal será aproximadamente normal, sin importar si la población de origen de los datos no tiene distribución normal.
Las probabilidades de la curva normal aplicadas a la distribución del promedio • Si la distribución de los promedios sigue una curvanormal, entonces hay una probabilidad total de ocurrencia de estos promedios, bajo la curva normal
x Las probabilidades de la curva normal aplicadas a la distribución del promedio 100% de probabi- lidades de todos los promedios obtenidos con muestras de tamaño n +1 +2 +3 -3 -2 -1 Unidades de desviación Unidades de error estándar
x Si la distribución de los promedios sigue una curva normal, entonces hay una probabilidad total de ocurrencia de estos promedios, bajo la curva normal 100% de probabi- lidades de todos los promedios obtenidos con muestras de tamaño n +1 +2 +3 -3 -2 -1 Unidades de desviación Unidades de error estándar
En resumen: • El promedio de todos los posibles promedios deinfinidad de muestras de tamaño n, cae exactamentesobre la media poblacional m. • Esto se debe a que laprobabilidad de cada promedio de caer por encima opor debajo de m es exactamente la misma, aunque la distribución de la variable original no sea normal ysiempre que el tamaño de la muestra sea grande.
Por lo tanto: • Utilizando las propiedades de la distribuciónnormal, se puede dar una magnitud a la probabilidadde ocurrencia de m a partir del promedio calculado. • Primero que nada, esto significa que entre menos una y más una unidad de error estándar(cualquiera sea su magnitud) se encuentra APROXIMADAMENTE, el 68% de esas probabilidades (etc, etc,...).
Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 10 tomadas sobre un total de 530 pesos (con promedio 38.9)
Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 10
Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 40 tomadas sobre un total de 530 pesos (con promedio 38.9)
Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 40
x 68% +1 +2 +3 -3 -2 -1
Probabilidades de 95 y 99% • Si queremos cubrir, a partir de nuestro estimadorde la media, un 95% de las probabilidades de incluir,con el mismo tamaño de muestra, la mediareal de la población, tenemos que dividir en dos unárea igual a 0.95. Esto da 0.475.
x La probabilidad de la media poblacional es simétrica alrededor de la media de la muestra m ? m ? m ? m ? m ? m ?
Límites de la curva normal para dejar sólo un 5% de probabilidad de error de no cubrir con el intervalo de confianza a la media poblacional 5% 95% 2.5% 2.5% z: -1.96 z: + 0.1.96
Probabilidades de 95 y 99% • El valor de z que deja hacia entre cero y z un 0.475de las probabilidades es 1.96.Esto significa que ± 1.96 unidades de error estándar a partir del promedio, se ubica ese 95% de probabilidades. • El valor respectivo para 99% de confianza es de 2.58.
Promedios e intervalos de confiaza de 95% para la media de la población, con muestras de tamaño 40
Estimación de intervalo: el error estándar de la media • Para conocer cuanta es la distancia hacia arriba ohacia debajo de la media, expresada en lasunidades de medición de la variable, sólo es necesariomultiplicar el error estándar (que estáexpresado enunidades de la variable) por el valor de z que definela probabilidad (ZP). La siguiente expresión se aplica CUANDO DE CONOCELA VARIANZA DE LA POBLACION: • x zPxs/n
EJEMPLO: Los datos siguientes corresponden a los niveles de Hormona Luteinizante (LH) en nanogramos por ml de suero de 5 ovejas administradas con Naloxona a las 20 semanas de edad, durante la noche y el día
Intervalo de confianza para la concentración diurna de LH. 1.96(s/n) 1.96(s/n) 0.62 conc. LH (ng/ml)
Intervalo de confianza para la concentración diurna de LH. 1.96 x 0.11 1.96 x 0.11 0.62 conc. LH (ng/ml)
Intervalo de confianza de 95% para la media de la concentración de LH en la población de referencia, asumiendo que se conoce la varianza de la población: 0.62 0.22 0.22 0.22 0.40 0.62 0.84 conc. LH (ng/ml)