430 likes | 1.12k Views
Inferencia basada en dos muestras. Inferencia basada en dos muestras. Hay dos muestras: m 1 ={X 11 , X 21 ,…, X n1 } m 2 ={X 12 , X 22 ,…, X n2 } Cada muestra proviene de una población. Ejemplos. Comparar el contenido de ácidos grasos en semillas de dos variedades distintas.
E N D
Inferencia basada en dos muestras Hay dos muestras: m1={X11, X21,…, Xn1} m2={X12, X22,…, Xn2} Cada muestra proviene de una población
Ejemplos • Comparar el contenido de ácidos grasos en semillas de dos variedades distintas. • Comparar el aumento de peso en animales alimentados con dos pasturas diferentes. • Comparar el efecto de dos dosis de un fungicida.
Ejemplos • Comparar los porcentajes de preñez bajo dos protocolos de inseminación artificial. • Comparar los porcentajes de lecturas positivas para una virosis en pruebas Elisa estándar y DAS-Elisa.
Contrastar hipótesissobre la diferencia (1-2) Inferencia basada en dos muestras El objetivo de la inferencia puede ser: • Estimarla diferencia entre las medias de las poblaciones (1-2) de las cuales proceden las muestras
Inferencia basada en dos muestras Si el contraste es bilateral:
Inferencia basada en dos muestras Si el contraste es unilateral derecho: Si el contraste es unilateral izquierdo:
Inferencia basada en dos muestras Varianzas poblacionales conocidas • Muestras independientes varianzas iguales Varianzas poblacionales desconocidas varianzas diferentes • Muestras dependientes
Inferencia basada en dos muestras El estadístico a usar en el contraste de medias depende de: • La naturaleza de las muestras • Si se conocen las varianzas poblacionales • Si las varianzas poblacionales son iguales o diferentes
Muestrasindependientes Inferencia basada en dos muestras Varianzas poblacionales conocidas La inferencia se basa en el estadístico: usualmente las varianzas son desconocidas
Muestrasindependientes Inferencia basada en dos muestras Varianzas poblacionales desconocidas ¿Cómo son las varianzas poblacionales? ¿Son iguales o diferentes?
Muestrasindependientes: Varianzas poblacionales desconocidas e iguales Inferencia basada en dos muestras La inferencia acerca de las medias se basa en el estadístico: Prueba Tpara muestras independientescuando las varianzas son homogéneas
Muestrasindependientes: Varianzas poblacionales desconocidas e iguales Inferencia basada en dos muestras Intervalo de confianza bilateral para la diferencia de medias está dado por:
Muestrasindependientes: Varianzas poblacionales desconocidas diferentes Inferencia basada en dos muestras La inferencia acerca de las medias se basa en el estadístico: Prueba Tpara muestras independientescuando las varianzas no son homogéneas
Caso Normal-Muestras independientes Muestrasindependientes: Varianzas poblacionales desconocidas diferentes Intervalo de confianza bilateral 1- para la diferencia de medias :
Ejemplo Se desea determinar si al usar fertilización nitrogenada en maíz, se modifica el promedio del peso del grano. Se realiza un ensayo en el cual se aplica fertilización a 24 parcelas experimentales y otras 24 parcelas no se fertilizan. Al finalizar el ensayo se registran los valores de la variable en estudio en mg. Las hipótesis propuestas son H0: 1= 2 vs H1: 12
Ejemplo Los resultados del ensayo son los siguientes:
¿Las varianzas poblacionales son iguales o diferentes? Inferencia basada en dos muestras Hipótesis Estadístico
Inferencia basada en dos muestras Contraste para la homogeneidad de varianzas Bajo H0 se distribuye como una F con 23 y 23 grados de libertad
Prueba F La región de aceptación para un nivel de significación del 5% está delimitada por 0.43 y 2.31, correspondientes a los cuantiles /2 y (1 - /2) respectivamente
Ejemplo Como F=1.13 está en el intervalo (0.43; 2.31) se acepta H0: 12= 22 Se concluye que no hay diferencias entre las varianzas poblacionales. Se cumple el supuesto de homogeneidad de varianzas
Prueba T Reemplazando:
Prueba T La región de aceptación para un nivel de significación del 5% está delimitada por -2.013 y 2.013, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 46 grados de libertad
Prueba T Como T=3.96 no pertenece al intervalo (-2.013; 2.013) se rechaza H0: 1= 2 Se concluye que hay diferencias entre las medias. El intervalo de confianza [24.11;73.94] construido con una confianza del 95% incluye al verdadero valor de la diferencia entre las medias
Prueba T para muestras independientes Ejemplo para uso de software En un estudio para analizar la evolución de tubérculos almacenados, se deseaba comparar dos épocas de cosecha: Abril y Agosto, las que determinan diferen-tes periodos de almacenamiento. La variable en estudio fue la pérdida de peso por deshidratación (en gr). El archivo Época contiene las observa-ciones del estudio.
Muestras dependientes Inferencia basada en dos muestras • Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo.
Ejemplo -Muestras dependientes • Se quiere comparar el efecto de dos virus sobre plantas de tabaco. • Se seleccionaron al azar 8 plantas y en cada una de ellas se tomaron 2 hojas apicales. • Sobre cada hoja se aplicaron los preparados conteniendo los virus cuyos efectos se querían evaluar. • La variable de respuesta fue la superficie en mm2 de las lesiones locales que aparecían como pequeñas manchas oscuras en las hojas.
Ejemplo o bien:
Caso Normal-Muestras dependientes • La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()
Caso Normal-Muestras dependientes • La prueba de hipótesis para la diferencia de medias basada en este estadístico se conoce como prueba T para muestras apareadas. • Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:
Ejemplo Fijando = 0.05, la región de aceptación es el intervalo (t/2=-2.365 , t1- /2= 2.365), con 7 grados de libertad
Ejemplo Como T=2.63 es mayor que t1- /2= 2.365, se rechaza H0: 1= 2 Se concluye que las diferencias observadas entre las áreas dañadas por uno u otro virus son estadísticamente significativas.
Prueba T para muestras apareadas Ejemplo para uso de software Para estudiar el efecto de la polini-zación sobre el peso promedio de las semillas obtenidas, se efectuó un experimento sobre 10 plantas. La mitad de cada planta fue polinizada y la otra mitad no. Se pesaron las semillas de cada mitad por separado, registrándose de cada planta un par de observaciones. El archivo Poliniza con-tiene los valores registrados