1 / 44

ANÁLISIS DE VARIANZA

ANÁLISIS DE VARIANZA. La distribución F (Fisher) Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales, y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. ANÁLISIS DE VARIANZA. La distribución F (Fisher)

Download Presentation

ANÁLISIS DE VARIANZA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ANÁLISIS DE VARIANZA La distribución F (Fisher) Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales, y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales.

  2. ANÁLISIS DE VARIANZA La distribución F (Fisher) La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA).

  3. ANÁLISIS DE VARIANZA Características de la distribución de F 1. Existe una “familia” de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los grados de libertad en el numerador y en el denominador.

  4. ANÁLISIS DE VARIANZA

  5. ANÁLISIS DE VARIANZA Características de la distribución de F 2. La distribución F es una distribución continua. 3. F no puede ser negativa. 4. La distribución F tiene sesgo positivo.

  6. ANÁLISIS DE VARIANZA Comparación de dos varianzas poblacionales La distribución F en este caso, se utiliza para probar la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal.

  7. ANÁLISIS DE VARIANZA Por ejemplo: Se calibran dos máquinas cortadoras que producen tablas de madera de la misma longitud. Por lo tanto, las tablas deben tener la misma longitud media y una variación similar.

  8. ANÁLISIS DE VARIANZA Por ejemplo: En este caso, la hipótesis nula es que la varianza de una población normal S12, es igual a la varianza de otra población normal S22. La hipótesis alternativa es que las varianzas sean distintas.

  9. ANÁLISIS DE VARIANZA Por ejemplo: Esta prueba de hipótesis se escribe: Ho: S12 = S22 H1: S12≠ S22 Para realizar la prueba se selecciona una muestra aleatoria de cada población: n1y n2.

  10. ANÁLISIS DE VARIANZA Por ejemplo: El estadístico de prueba es S12 / S22, donde S12 y S22 son las respectivas varianzas muéstrales, con n1 – 1 y n2 – 1 grados de libertad. A fin de reducir el tamaño de la tabla de valores críticos, la mayor varianza muestral se coloca en el numerador; por lo tanto, el valor F de la tabla siempre es mayor a 1.00

  11. ANÁLISIS DE VARIANZA Ejemplo 2: Maderables Transportistas S.A ofrece servicio desde la Península de Osa, hasta el Aeropuero Juan Santamaría. Para efectuar sus servicios puede escoger entre dos rutas alternativas.

  12. ANÁLISIS DE VARIANZA Ejemplo 2: Ruta Tiempo (min) Desv Sta Tamaño muestra A 56 12 7 B 58 5 8

  13. ANÁLISIS DE VARIANZA Solución: La empresa observó que los tiempos medios son similares, pero hay mayor variación en la ruta A en comparación con la ruta B. Lo anterior puede deberse a que en la ruta A hay más semáforos; sin embargo, la ruta B es más larga.

  14. ANÁLISIS DE VARIANZA Solución: Es importante que el servicio que se ofrece sea oportuno y consistente, por lo que decide realizar una prueba estadística para determinar si existe una diferencia real en la variación en ambas rutas.

  15. ANÁLISIS DE VARIANZA Solución (paso 1): Se comienza estableciendo la hipótesis nula y alternativa. La prueba tiene dos colas, porque se busca la diferencia de variación entre ambas rutas. Ho: S12 = S22 H1: S12 ≠ S22

  16. ANÁLISIS DE VARIANZA Solución (paso 2): Se selecciona el nivel de significancia de 5% Paso 3:El estadístico de prueba apropiado es S12 / S22 que sigue al distribución F.

  17. ANÁLISIS DE VARIANZA Solución (paso 4): La F tabular o valor crítico se obtiene con base en la tabla de distribución F***

  18. ANÁLISIS DE VARIANZA Solución (paso 4): Existen: n1 – 1= 7 – 1 = 6 gL en el numerador n2 – 1= 8 – 1= 7 gL en el denominador

  19. ANÁLISIS DE VARIANZA Solución (paso 4): El valor crítico es 3,87. Por lo tanto, la regla de decisión es: si la relación de las varianzas de la muestra S12 / S22 es diferente a 3,87 la hipótesis nula se rechaza.

  20. ANÁLISIS DE VARIANZA Solución (paso 5): Determine el valor estadístico de prueba tomando la relación de las dos varianzas muestrales, como se observa a continuación: F= S12 / S22

  21. ANÁLISIS DE VARIANZA Solución (paso 5): F= S12 / S22 F= (12)2 / (5)2 F= 5,76 Se rechaza la hipótesis nula y se acepta la alternativa. Se concluye que existe una diferencia en las variaciones en el tiempo de recorrido en ambas rutas.

  22. SUPOSICIONES DE LA ANOVA Otro uso de la distribución F es la técnica del análisis de varianza (ANOVA), en la que se comparan tres o más medias muestrales para determinar si provienen de poblaciones iguales.

  23. SUPOSICIONES DE LA ANOVA Para utilizar esta técnica, se supone lo siguiente: 1. Las poblaciones tienen una distribución normal. 2. Las poblaciones tienen desviaciones estándar iguales. 3. Las muestras se seleccionan de manera indepen-diente.

  24. SUPOSICIONES DE LA ANOVA ANOVA tuvo sus inicios en la agricultura, y muchos de los términos que se relacionan con ese contexto permanecen vigentes. En particular, se emplea el término tratamiento para identificar las diferentes poblaciones que se examinan.

  25. SUPOSICIONES DE LA ANOVA Ejemplo: José Pérez, propietario de una empresa agrícola productora de maíz, desea utilizar la marca de fertilizante que produzca el máximo rendimiento de maíz por unidad de superficie.

  26. SUPOSICIONES DE LA ANOVA Ejemplo: Pérez puede elegir entre tres marcas comerciales diferentes: Wolfe, White y Korosa. Para empezar, Pérez divide su campo en 12 parcelas de igual tamaño.

  27. SUPOSICIONES DE LA ANOVA Ejemplo: Luego planta el maíz al mismo tiempo y del mismo modo. La única diferencia en las parcelas es que Pérez asigna al azar la marca Wolfe a cuatro de ellas, White a otras cuatro y Korosa a las últimas cuatro.

  28. SUPOSICIONES DE LA ANOVA Ejemplo: Al final de la temporada Pérez registra la cantidad de mazorcas de maíz que se produjo en cada parcela: Wolfe White Korosa 55 66 47 54 76 51 59 67 46 56 71 48

  29. SUPOSICIONES DE LA ANOVA Ejemplo: ¿Existe una diferencia en el número de mazorcas de maíz que se produjeron?

  30. SUPOSICIONES DE LA ANOVA Ejemplo: Ahora suponga que las poblaciones son iguales; o sea, que no hay diferencia en las medias de fertilización (tratamiento). Esto indicaría que las medias poblacionales son las mismas.

  31. SUPOSICIONES DE LA ANOVA ¿Por qué es importante la prueba ANOVA? Porque a través de otros métodos como la t de Student, sería necesario hacer comparaciones de medias poblacionales de par en par y con la ANOVA se pueden comparar varias medias al mismo tiempo.

  32. LA PRUEBA ANOVA Haciendo referencia al ejemplo de la empresa de José Pérez, éste desea determinar si existe una diferencia en los rendimientos medios de maíz para diversos fertilizantes.

  33. LA PRUEBA ANOVA Para comenzar, se debe encontrar el rendimiento medio promedio de maíz para TODAS las parcelas de tierra. O sea: (55 + 54 + … + 48) / 12 = 58

  34. LA PRUEBA ANOVA A continuación, para cada una de las doce parcelas, encontrar la distancia entre el desarrollo de esa parcela en particular y la media general. Cada una de las diferencias se eleva al cuadrado y se suman dichos cuadrados. Este término se conoce como variación total.

  35. VARIACIÓN TOTAL “Es la suma del cuadrado de las diferencias entre cada observación y la media global”. En el ejemplo, la variación total es: (55 - 58)2 + (54 - 58)2 + … + (48 - 58)2= 1082

  36. VARIACIÓN TOTAL A continuación, se debe separar la variación total en sus dos componentes: el que se debe a los tratamientos y el aleatorio.

  37. VARIACIÓN DE LOS TRATAMIENTOS “La suma del cuadrado de las diferencias entre la media de cada tratamiento y la media global”. Para calcularlo primero es preciso encontrar el rendimiento medio de cada uno de los tres tratamientos.

  38. VARIACIÓN DE LOS TRATAMIENTOS El rendimiento medio para Wolfe es: (55 + 54 + 59 +56) / 4 =56 Las otras medias son: 70 para White y 48 para Korosa.

  39. VARIACIÓN DE LOS TRATAMIENTOS La suma de los cuadrados debidos a los tratamientos es: 4 (56 - 58)2 + 4 (70 - 58)2 + 4 (48 - 58)2 =992 Rendimiento promedio de las 12 parcelas en total Número de parcelas por tratamiento. En el ejemplo son 4 para Wolfe, 4 para White y 4 para Korosa Rendimiento medio de cada tratamiento internamente

  40. VARIACIÓN DE LOS TRATAMIENTOS La otra fuente de variación a que se hace referencia es el componente aleatorio, o componente de error.

  41. VARIACIÓN ALEATORIA En el ejemplo del fertilizante, este término es la suma del cuadrado de las diferencias entre el rendimiento promedio de maíz de cada parcela y la media del rendimiento para el tratamiento específico: (55 - 56)2 + (54 - 56)2 + … + (48 - 48)2 =90

  42. LA PRUEBA ANOVA Se determina el estadístico F, que es la relación de los dos estimadores de la varianza de la población, con base en la ecuación siguiente: Variación de tratamiento / n - 1 Estimado de la varianza de la población con base en la diferencias entre las medias de muestra 992 / 2 = F = 90 / (12 - 3) Estimado de la varianza de la población con base en la variación dentro de la muestra Variación aleatoria / número de observaciones – número de tratamientos

  43. LA PRUEBA ANOVA 992 / 2 = 49.6 Fc = 90 / (12 - 3) Para el F tabular los grados de libertad en el numerador equivalen al número de tratamientos, designados como K, menos 1. Los grados de libertad en el denominador son el número total de observaciones, n, menos el número de tratamientos. Grados de libertad en el numerador: k - 1 Grados de libertad en el denominador: n - k

  44. PRÁCTICA La información siguiente pertenece a una muestra. Pruebe la hipótesis de que las medias de tratamientos son iguales. Utilice el nivel de significancia de 0.05 Tratamiento 1 Tratamiento 2 Tratamiento 3 8 3 3 6 2 4 10 4 5 9 3 4 A) Establezca la hipótesis nula y alternativa. B) Cuál es la regla de la decisión? C) Cuál es el resultado final?

More Related