610 likes | 1.05k Views
Inferencia Estadística. Estimación de Parámetros. Estimación. Buscar valores razonables para los parámetros que caracterizan una distribución. Si la distribución supuesta es normal, los parámetros más buscados son la esperanza o media ( µ) y la varianza ( 2 ). Ejemplo.
E N D
Inferencia Estadística Estimación de Parámetros
Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución supuesta es normal, los parámetros más buscados son la esperanza o media (µ) y la varianza (2)
Ejemplo Una empresa de comercialización de semillas deseaestimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello se toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser de 130 cm.
Estimación • estimación puntual • por intervalo de confianza
Estimación Puntual su promedio es igual a µ la media muestral es un estimador Insesgado Consistente Eficiente está más cerca de µ a medida que crece el tamaño de la muestra es más eficiente que la mediana por tener menor varianza de la media poblacional
Intervalos de Confianza Encontrar el intervalo cerrado [LI, LS] donde: LI = Límite Inferior LS = Límite Superior Entonces: P(LI ≤≤ LS) = 1-
Intervalo de Confianza para µ Si 1- = 0.95,puede interpretarse como: “si se tomaran todas las muestras posibles de tamañony se construyeran100 intervalos, 95 incluirán a la verdadera media poblacional µ y sólo 5 no la contendrán”
Ejemplo Se sabe que =22 cm. Un intervalo para estimar a con una confianza del 95%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 95% de confianza
Ejemplo Un intervalo para estimar a con una confianza del 99%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 99% de confianza
Efecto del cambio en el nivel de confianza Sea la amplitud a = LS – LI Si la confianza es del 95% a= 136.05 – 123.95 = 12.1 Si la confianza es del 99% a= 138.01 – 121.98 = 16.03 A mayor confianza mayor amplitud
Efecto del cambio en el tamaño de la muestra Para una confianza del 99% y n = 50 a = 138.01 – 121.98 = 16.03 Si n = 100 a = 135.67 – 124.33 = 11.34 A mayor n menor amplitud
Conclusión La amplitud de un intervalo de confianza es directamente proporcional a la confianza de la estimación e inversamenteproporcional al tamaño de la muestra
Intervalos de Confianza • Efecto del coeficiente de confianza y del tamaño muestral sobre la amplitud del intervalo Tamaño muestral necesario para estimar un parámetro con una precisión deseada
Tamaño de Muestra para estimar a µ con una precisión deseada ¿Cuál debería ser el tamaño mínimo de muestra, para que la amplitud no supere los 12.1 cm, cuando se aumenta la confianza al 99%?
Tamaño de Muestra para estimar a µ con una precisión deseada Donde ces la amplitud del intervalo de confianza
Ejemplo Se debería tomar una muestra de al menos 88 plantas para que al estimar la altura promedio del sorgo forrajero con una confianza del 99% la amplitud del intervalo no sea mayor a 12,1
Otro ejemplo Se desea utilizar un suelo cuya profundidad no sea inferior a 75cm Intervalos de confianza Bilateral Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) LS(95%) A prof Media 81,79 2,35 14 76,71 86,86 B prof Media 79,43 2,62 14 73,77 85,08
Otro ejemplo Intervalos de confianza Unilateral izquierdo Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) A prof Media 81,79 2,35 14 77,63 B prof Media 79,43 2,62 14 74,79
Inferencia basada en una muestra Contraste de Hipótesis
H0: 75 vs. H1: > 75 Hipótesis nula (H0) Hipótesis estadísticas • Son proposiciones sobre uno o más parámetros de la distribución de la variable aleatoria en estudio. Hipótesis alternativa (H1) establece valores o relaciones sobre uno o más parámetros niega la hipótesis nula
Ejemplo profundidad del suelo Prueba T para un parámetro Valor del parámetro probado: 75 campos Variable n Media DE LI(95) T p(Unilateral D) A prof 14 81,79 8,79 77,63 2,89 0,0063 B prof 14 79,43 9,80 74,79 1,69 0,0573
Inferencia basada en dos muestras Estimación de Parámetros Contraste de Hipótesis
Inferencia basada en dos muestras • Contrastar hipótesis sobre la diferencia entre dos medias Si el contraste es bilateral: versus
Caso Normal-Muestras independientes Varianzas desconocidas pero iguales La inferencia se basa en el siguiente estadístico: prueba Tpara muestras independientescuando las varianzas son homogéneas
Caso Normal-Muestras independientes Varianzas desconocidas pero iguales Intervalo de confianza bilateral para la diferencia de medias está dado por:
Ejemplo Para comparar el contenido promedio de aceites de las semillas de dos variedades de maní, se plantean las hipótesis H0: 1= 2 vs H1: 12 Se diseña un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1 kg de semillas de maní, extraídas aleatoriamente de distintos productores de semillas.
Ejemplo Los resultados del ensayo son los siguientes:
¿Cómo saber si las varianzas son iguales o diferentes? Suponiendo normalidad para las observaciones de las muestras, una prueba de homogeneidad de varianzas se basa en el estadístico:
¿Cómo saber si las varianzas son iguales o diferentes? versus Bajo H0 se distribuye como una F con 9 y 9 grados de libertad
Prueba F La región de aceptación para un nivel de significación del 5% está delimitada por 0.248 y 4.03, correspondientes a los cuantiles /2 y (1 - /2) respectivamente
Ejemplo Como F=0.96 está en el intervalo (0.248; 4.03) se acepta H0: 12= 22 Se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el cumplimiento del supuesto de homogeneidad de varianzas
Prueba T La región de aceptación para un nivel de significación del 5% está delimitada por -2.101 y 2.101, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 18 grados de libertad
Prueba T Como T=-1.42 está en el intervalo (-2.101; 2.101) se acepta H0: 1= 2 Se concluye que no hay diferencias entre las dos variedades de maní considerando el contenido de aceites en la semilla
Caso Normal-Muestras independientes Varianzas desconocidas y diferentes La inferencia se basa en el estadístico: prueba Tpara muestras independientes cuando las varianzas no son homogéneas
Caso Normal-Muestras independientes Varianzas desconocidas y diferentes Intervalo de confianza bilateral 1- para la diferencia de medias está dado por:
Prueba T – Otro ejemplo Comparar el efecto de la restriccion alimentaria sobre los metabolitos Ca y P. Se realiza un experimento en el cual se seleccionan al azar 10 animales para cada tratamiento: alimentación restrigida y alimentación no restringida. En cada animal se mide el nivel de Ca y de P.
Prueba T - Muestras independientes Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat Ca {No Restr} {Restr} 10 10 media(1) media(2) LI(95%) LS(95%) 8,87 8,68 -0,71 1,09 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,33 0,49 0,1490 0,45 18 p prueba 0,6612 Bilateral
Prueba T - Muestras independientes Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat P {No Restr} {Restr} 10 10 media(1) media(2) LI(95%) LS(95%) 7,92 8,00 -1,03 0,86 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,65 0,23 0,0072 -0,19 12 p prueba 0,8530 Bilateral
Prueba T - Muestras independientes Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) n(1) Lecitina lts./dia {CON}{SIN} 9 n(2) media(1) media(2) LI(95%) LS(95%) 8 17,71 14,45 2,304,22 Varianza(1) Varianza(2) p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,25 15 <0,0001Bilateral
Prueba T - Muestras independientes Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) Lecitina lts./dia {CON}{SIN} n(1) n(2) media(1) media(2) LI(95%)LS(95%) 9 8 17,71 14,45 2,47 sd Varianza(1) Varianza(2) p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,25 15 <0,0001UnilatD
Caso Normal- Muestras dependientes • Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo. • Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los individuos de un grupo experimental antes y después de la administración de una droga.
Caso Normal- Muestras dependientes • El objetivo es comprobar si la droga produce efectos en el nivel del metabolito • Los pares de observaciones (antes y después) obtenidas en cada individuo no son independientes ya que el nivel posterior a la administración de la droga depende del nivel inicial.
Caso Normal- Muestras dependientes • La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()
Caso Normal- Muestras dependientes • La prueba de hipótesis para la diferencia de medias se conoce como prueba T para muestras apareadas. • Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:
Caso Normal- Muestras dependientesEjemplo ANTES DESPUES DIF 8,69 7,24 1,45 7,13 7,10 0,03 7,79 7,80 -0,01 7,93 7,95 -0,02 7,59 7,50 0,09 7,86 7,79 0,07 9,06 9,00 0,06 9,59 9,48 0,11
Caso Normal- Muestras dependientesEjemplo Prueba T (muestras apareadas) Obs(1) Obs(2) N media(dif) ANTES DESPUES 8 0,22 DE(dif) LI(95%) LS(95%) T 0,50 -0,19 0,64 1,26 Bilateral 0,2469
Errores en la Prueba de Hipótesis Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es posible cometer errores
Es incorrecto si fuesefalsa Es incorrecto si fueseverdadera Errores Frente a una hipótesis nula se toma una decisión Aceptar H0 Rechazar H0 o
Error de tipo I • Error de Tipo I la hipótesis nula es cierta y se rechaza erróneamente • La probabilidad de cometer este tipo de error está bajo control del experimentador. Su máximo valor se simboliza con y recibe el nombre de nivel de significación