E N D
Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) en el que la variable analizada la hacemos depender de un sólo factor de tal manera que las causas de su variabilidad son englobadas en una componente aleatoria que se denomina error experimental.
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de X poblaciones (X >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de X 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.
El Anova requiere el cumplimiento los siguientes supuestos: • Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales. • Las X muestras sobre las que se aplican los tratamientos son independientes. • Las poblaciones tienen todas igual varianza (homoscedasticidad). El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la media global (SCT), que bajo el supuesto de que H0 es cierta es una estimación obtenida a partir de toda la información muestral, en dos partes: • Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores de cada muestra con respecto a sus correspondientes medias. • Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las muestras con respecto a la media global.
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las siguientes: • Media Global: Variación Total: • Variación Intra-grupos: • Variación Inter-grupos: Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
La secuencia para realizar un ANOVA es: • Analizar • Comparar medias • ANOVA de un factor Se abre el siguiente cuadro de diálogo:
Se selecciona la variable que se considera Dependiente y la variable Factor y con el botón Opciones se activan EstadísticosDescriptivosy Homogeneidadde varianzas
Al aceptar en el visor de resultados aparecen los siguientes cuadros: • Descriptivos. Recoge la media, la desviación típica, el intervalo de confianza del 95% (por defecto) para la media correspondientes a la variable dependiente para cada uno de los grupos definidos por el factor. • Prueba de homogeneidad de varianzas. Contiene el valor del estadístico de Levene del contraste de la hipótesis de homoscedasticidad con el nivel de significación crítico. • ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus correspondientes grados de libertad y el valor del estadístico de prueba F junto con el nivel de significación crítico. • Como complemento gráfico de este análisis, para obtener una primera aproximación acerca de si es razonable o no la hipótesis nula, se selecciona Gráficos > Barras de error y se activa la opción Simple. Con el botón Definir se abre el siguiente cuadro de diálogo:
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categorías la variable factor. El intervalo de confianzapara la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el visor de resultados los puntos que representan a la media de cada grupo junto con los límites del correspondiente intervalo de confianza para la media poblacional. Si los puntos que representan las medias están desigualmente distribuidos en el gráfico se tiene un indicio de que a nivel poblacional no puede sostenerse la hipótesis de igualdad de medias; es decir, por lo menos uno de los niveles del factor influye significativamente sobre la variable dependiente.
EJEMPLOS Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que el tipo de transporte utilizado, Trans, influye sobre la variable tiempo. Con la opción de menú Gráficos > Barras de error > Simple y con el botón Definir se selecciona como Variable Tiempo y en Eje de categorías la variable Trans; al aceptar se obtiene la siguiente representación gráfica:
Este cuadro contiene un análisis descriptivo de la variable dependiente por grupos, así como, los límites superior e inferior para la media de cada grupo al 95% de confianza El estadístico de Levene toma un valor lo suficientemente pequeño para no rechazar la hipótesis de homocesdaticidad a los niveles de significación habituales.
En el cuadro de resultados del ANOVA, el valor del estadístico de prueba, F=6,450, es significativamente distinto de 1 para cualquier nivel de significación y, por lo tanto, se rechaza la hipótesis nula de igualdad de medias y queda confirmada la primera impresión proporcionada por el gráfico de barras de error.