130 likes | 272 Views
Análisis de Varianza con Dos Criterios de Clasificación. CO2124. Si se tienen dos “ FACTORES ” se desea determinar si la combinación de ellos es influyente ó si alguno de ellos o ambos son significativos.
E N D
Análisis de Varianza con Dos Criterios de Clasificación CO2124 Si se tienen dos “FACTORES” se desea determinar si la combinación de ellos es influyente ó si alguno de ellos o ambos son significativos. En otras palabras se desea determinar si existe influencia de cada uno de los factores y si existe “INTERACCIÓN”. Práctica 6 1
B1 B2 A1 20 30 A2 50 12 B1 B2 A1 20 30 A2 40 52 Análisis de Varianza con Dos Criterios de Clasificación CO2124 ¿ Qué significa Interacción ? Ejemplo 1 Ejemplo 2 No hay interacción Al cambiar del Nivel 1 al 2 en el factor B hay un aumento en la respuesta media del Nivel 1 del factor A, ese mismo aumento se ve reflejado en el nivel 2. Al cambiar del nivel 1 al 2 en el factor B hay un aumento en la respuesta media del nivel 1 del factor A, pero para el nivel 2 existe una disminución de la respuesta media. Si hay Interacción Práctica 6 2
Análisis de Varianza con Dos Criterios de Clasificación CO2124 El modelo considerado para el análisis es: Yijk = ij + i = 1,...,a; j = 1,...,b; k = 1, ... ,n. Este no permite diferenciar la influencia de las filas, columnas e interacción por lo que se puede reparametrizar por: Yijk = + i + j + ()ij + ijk donde: : Media general. i : Efecto de la fila. j : Efecto de la columna. ij : Efecto de la interacción. Restricciones: i = 0 ; j = 0 ; ij = 0 ; ij = 0 Nuevamente se trata de un modelo lineal, y se supone que los errores tienen distribución ijk ~ N(0,2I). Práctica 6 3
Análisis de Varianza con Dos Criterios de Clasificación CO2124 • Hipótesis de interés: • Todas las filas son iguales: • H0A: 1= 2=. . . =a= 0 vs H1A: algún i 0 • Todas las columnas son iguales: • H0B: 1= 2=. . . = b= 0 vs H1B: algún j 0 • No hay interacción entre filas y columnas: • H0AB: ij= 0 para todo i, j vs H1AB: algún ij 0 • Si no se rechaza H0AB, no tiene sentido eliminar del modelo los efectos de A y B. • Se emplearan las mismas técnicas que en el caso de análisis de Varianzas de una vía para comprar las medias de dos tratamientos, esto es, • Ho: ij = kl vs H1: ij kl • Así mismo, en caso de problemas con las varianzas pueden aplicarse las técnicas para estimar las transformaciones Práctica 6 4
Análisis de Varianza con Dos Criterios de Clasificación CO2124 Ejercicio: Los datos provienen de un reporte de una importante industria petrolera donde citan un filtro para automóviles, desarrollado por una compañía asociada, como efectivo en reducir la contaminación. A pesar de esto, se quisiera determinar los efectos de estos filtros en la ejecución del vehículo, el rendimiento del combustible y específicamente en sus niveles de contaminación sonora. Los datos aquí incluidos son mediciones de estos niveles de ruido y son usados por la industria como evidencia de que las propiedades silenciadoras del referido filtro eran al menos tan buenas a las de los filtros estándares. Realice el análisis estadístico pertinente para determinar si las conclusiones a las que llega esta industria petrolera tienen soporte estadístico. Observación: Seleccione entre los factores Tamaño y Lado para realizar el análisis de varianza de dos vías. ¿Cuál cree que fue el factor selccionado por la industria? Justifique su selección. Práctica 6 5
Dos Criterios de Clasificación CO2124 Descripción de las Variables: Ruido = lecturas de niveles de ruido (decibeles) Tamaño = Tamaño del vehículo: 1 pequeño, 2 mediano, 3 grande Tipo = 1 filtro standard , 2 filtro Octel Lado = 1 lado derecho, 2 lado izquierdo del vehículo Se leen los datos referentes a los filtros citados por la industria petrolera: >filtro<-read.table(“filtro.txt”, header=T) >attach(filtro) >objects(2) Para determinar si existe interacción entre el Tamaño del filtro y el Lado se considera la instrucción (interaction.plot). > interaction.plot(Tama,Lado,Ruido,col=1:2) Práctica 6 6
Dos Criterios de Clasificación CO2124 En este gráfico podemos observar que, en autos pequeños, el lado izquierdo del auto es más cuidado, pero este resultado no es igual para los tres tipos de autos. Para los autos grandes, el ruido es más pequeño en el lado izquierdo que en derecho, es decir, es más efectivo el filtro y además es mucho menor que para carros pequeños y medianos. La falta de paralelismo en el gráfico de interacción nos indica que existe interacción entre el tamaño y el lado del filtro utilizado. Otra interacción posible es: >interaction.plot(Lado,Tama,Ruido,col=1:2) Práctica 6 7
Dos Criterios de Clasificación CO2124 Tipo<-factor(Tipo) Tama<-factor(Tama) Lado<-factor(Lado) filtro.mod1<- aov(Ruido~Tipo + Tama + Tama*Tipo) summary(filtro.mod1) Df Sum Sq Mean Sq F value Pr(>F) Tipo 1 1056.2 1056.2 16.1465 0.0003631 *** Tama 2 26051.4 13025.7 199.1189 < 2.2e-16 *** Tipo:Tama 2 804.2 402.1 6.1465 0.0057915 ** Residuals 30 1962.5 65.4 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Al probar la hipótesis Ho AB: ij = 0, esta es rechazada, lo que nos indica que hay interacción entre el Tipo y el tamaño del vehículo. Luego, los factores individuales deben ser considerados en el modelo. Ahora se considera el gráfico de residuos, > plot(fitted.values(filtro.mod1),rstandard(filtro.mod1),pch=20) Práctica 6 8
Dos Criterios de Clasificación CO2124 Para eliminar los efectos de posible heterocedasticidad en la varianza, calculamos una transformación. Para ello, consideramos los promedios y las desviaciones estándar para cada tratamientos en el factor Tipo, condicionado a el Tamaño. Por ejemplo, si condicionamos a que el tamaño del vehículo sea igual a 1 (Pequeño), los promedios y desviaciones serían: mu1<-mean(Ruido[Tipo==1& Tama==1]) mu2<-mean(Ruido[Tipo==2& Tama==1]) mu3<-mean(Ruido[Tipo==1& Tama==2]) mu4<-mean(Ruido[Tipo==2& Tama==2]) des1<-sqrt(var(Ruido[Tipo==1& Tama==1])) des2<-sqrt(var(Ruido[Tipo==2& Tama==1])) des3<-sqrt(var(Ruido[Tipo==1& Tama==2])) des4<-sqrt(var(Ruido[Tipo==2& Tama==2])) promedios<-c(mu1,mu2,mu3,mu4) desviaciones<-c(des1,des2,des3,des4) lpro<-log(promedios) ldes<-log(desviaciones) alpha<-lm(ldes~lpro) Práctica 6 9
Dos Criterios de Clasificación CO2124 Para conocer si existen diferencias entre los diferentes tamaños, aplicamos una prueba de Mínima Diferencia Significativa. La instrucción sería, pairwise.t.test(Ruido[tama==1],tipo[tama==1],p.adjust.method="none") Pairwise comparisons using t tests with pooled SD data: Ruido[tama == 1] and tipo[tama == 1] 1 2 0.48 P value adjustment method: none Si consideramos el factor lado del vehículo, el modelo es el siguiente, filtro.mod2<- aov(Ruido~Tipo*Lado) summary(filtro.mod2) Df Sum Sq Mean Sq F value Pr(>F) Tipo 1 1056.2 1056.2 1.1736 0.2868 Lado 1 0.7 0.7 0.0008 0.9780 Tipo:Lado 1 17.4 17.4 0.0193 0.8904 Residuals 32 28800.0 900.0 Práctica 6 10
Dos Criterios de Clasificación CO2124 > qqnorm(residuals(filtro.mod1)) > qqline(residuals(filtro.mod1)) Práctica 6 11
Dos Criterios de Clasificación CO2124 Si en vez de tomar un análisis de dos vías consideramos un análisis de tres vías, el resultado es el siguiente: filtro.mod2<- aov(Ruido~tipo*tama*lado) summary(filtro.mod2) Df Sum Sq Mean Sq F value Pr(>F) tipo 1 1056.2 1056.2 72.4286 1.038e-08 *** tama 2 26051.4 13025.7 893.1905 < 2.2e-16 *** lado 1 0.7 0.7 0.0476 0.8291042 tipo:tama 2 804.2 402.1 27.5714 6.048e-07 *** tipo:lado 1 17.4 17.4 1.1905 0.2860667 tama:lado 2 1293.1 646.5 44.3333 8.730e-09 *** tipo:tama:lado 2 301.4 150.7 10.3333 0.0005791 *** Residuals 24 350.0 14.6 --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Práctica 6 12
Dos Criterios de Clasificación CO2124 > boxplot(split(Ruido,Tama)) > boxplot(split(Ruido[Lado==2],Tama[Lado==2])) Práctica 6 13