330 likes | 563 Views
Capítulo III. Análisis de varianza. Introducción. En el capítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso. Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos.
E N D
Capítulo III Análisis de varianza
Introducción • En el capítulo anterior se analizaron únicamente dos grupos, sin embargo, la realidad es usualmente más compleja que eso. • Frecuentemente se requiere comparar tres, cuatro, cinco o más muestras de grupos. • No es posible emplear la razón t para comparar por pares dichas muestras, ya que implicaría gran trabajo y errores (alpha), por ello existe el ANÁLISIS DE VARIANZA.
La lógica del análisis de varianza • Para efectuar dicho análisis se requieren dos conceptos: • VARIACIÓN DENTRO DE LOS GRUPOS: Es la distancia entre los puntajes crudos y su media del grupo. • VARIACIÓN ENTRE GRUPOS: La distancia entre las medias de los grupos.
La lógica del análisis de varianza • Dichas variaciones se pueden relacionar con la prueba de la razón t, así: • Este análisis de varianza produce una razón F, cuyo numerador indica la variación entre los grupos, y cuyo denominador representa la variación dentro de los grupos. Variación entre grupos Variación dentro de los grupos
La sumas de cuadrados • Este concepto se empleó al obtener la desviación estándar, cuando se elevaron al cuadrado las desviaciones de la media de una distribución. Dicho procedimiento eliminaba de manera matemática sólida, los signos negativos que pudieran existir. • Existen distintas sumas de cuadrados: • SCTotal: Suma de cuadrados total. • SCent: Suma de cuadrados entre grupos. • SCdentro: Suma de cuadrados dentro de los grupos.
La suma de cuadrados dentro de los grupos (SCdentro) • Por fórmula: • Donde: • X=Un puntaje de desviación (X-X) • APLICANDO LA FÓRMULA PARA LOS SIGUIENTES DATOS: • X1= 1,2,1,2 • X2= 1,3,2,2
La suma de cuadrados entre los grupos (SCent) • La suma de cuadrados entre los grupos representa la suma de las desviaciones de cada media muestral de la media total elevadas al cuadrado. • Por fórmula: • Donde: • X=cualquier media muestral • Xtotal= la media total (la media de los puntajes crudos de la totalidad de las muestras combinadas) • N=el número de puntajes de cualquier muestra • SCent=la suma de cuadrados entre los grupos.
La suma de cuadrados entre los grupos (SCent) • SCent= (1.50-1.75)2 4 + (2.0-1.75) 2 4 + (1.75-1.75)24 + (1.75-1.75)24 • SCent= (-0.25)24 + (0.25)2 4 + (0)24 + (0)2 4 • SCent= (0.06)4 + (0.06)4 + (0)4 + (0)4 • SCent= 0.24+ 0.24 • SCent= 0.48
La suma total de cuadrados (SCtotal) • La suma total de cuadrados es igual a la combinación de sus componentes dentro y entre los grupos. • Por fórmula: • SCTotal= SCent + SCdentro • SCTotal= 0.48 + 6.48 • SCTotal= 6.96
La suma total de cuadrados (SCtotal) • También se puede hallar con la fórmula: • Donde: • X=un puntaje crudo en cualquier muestra. • Xtotal= la media total (la media de todos los puntajes crudos de todas las muestras combinadas). • SCTotal=la suma total de cuadrados. • Se suman todas las desviaciones al cuadrado con respecto de la media total. Ver pág. 71.
Cómo calcular las suma de cuadrados • Los procedimientos anteriores son en extremos tardados y difíciles, por ello existen fórmulas más simples para calcular las sumas de cuadrados. • Donde: • N total=el número total de puntajes de todas las muestras combinadas.
La suma de cuadrados entre los grupos (SCent) • En nuestro caso: • Donde: = A la sumatoria de los puntajes de cada muestra al cuadrado. = A la sumatoria de todos los puntajes al cuadrado. • N=el número total de puntajes en cualquier muestra. • N total= el número total de puntajes en todas las muestras combinadas.
La suma de cuadrados entre los grupos (SCent) • Sustituyendo:
La suma de cuadrados dentro los grupos (SCdentro) • Se puede calcular por simple despeje:
La suma de cuadrados dentro los grupos (SCdentro) • Solo para verificar en busca de errores:
La media cuadrática • La suma de cuadrados tiende a crecer conforme aumenta N, por lo cual, dichas medidas no se pueden considerar “puras”. Por ellos, se requiere un medio de control que evite esto. • Para ello existe la “media cuadrática”. Por fórmula: • Donde: =la media cuadrática entre los grupos. Scent = la suma de cuadrados entre los grupos. glent =los grados de libertad entre los grupos.
La media cuadrática Y también: Donde: = la media cuadrática dentro de los grupos. SCdentro = la suma de cuadrados dentro de los grupos. gldentro = los grados de libertad dentro de los grupos.
La media cuadrática • Pero primero hay que obtener los grados de libertad apropiados: • Para la media cuadrática entre los grupos: glent= K-1 Donde: K= el número de muestras. Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K Donde: N total= el número total de puntajes en todas las muestras combinadas. K= el número de muestras.
La media cuadrática • Sustituyendo con los datos anteriores: glent= K-1 glent= 4-1 glent=3 Para encontrar la media cuadrática dentro de los grupos. gldentro= N total – K gldentro= 16-4 gldentro= 12
La media cuadrática • Ahora solo falta obtener las medias cuadráticas:
Razón o cociente F • El análisis de varianza produce una razón f que sirve para comparar la variación entre los grupos y dentro de los grupos. • Por fórmula: • Para los datos vistos: • Ahora estamos listos para rechazar o para aceptar la hipótesis nula. (Con la tabla D).
Razón o cociente F • La tabla D se interpreta, para el numerador (glent: grados de libertad entre) se indican en la parte superior de la tabla; el denominador (gldentro) se indican al lado izquierdo. • Para nuestro caso: • glent =3 • gldentro =12 • Así se encuentra un valor de: 3.49.
Razón o cociente F • Así que la razón F de la tabla fue de 3.49. • Y la razón F calculada fue de 0.31 • Por lo tanto la razón F calculada, debe ser igual o mayor que la de la tabla para rechazar la hipótesis nula; sin embargo, en este caso como fue de solo 0.31, debemos aceptar que no hay diferencias significativas entre los grupos y se acepta la hipótesis nula. • PARA EL EJEMPLO COMPLETO. (Ver. Págs. 77-80).
Comparación múltiple de medias • Con el fin de averiguar dónde se encuentran exactamente las diferencias significativas entre los grupos, cuando F obtenida, es igual o mayor que la F de la tabla, se emplea una nueva prueba, a saber: la DSH (Honestlysignificantdifference: diferencia honestamente significartiva)de Turkey.
Comparación múltiple de medias • Por fórmula: • Donde: qa = un valor de la tabla a un nivel de confianza dado para el número máximo de medias que se estén comparando. = la media cuadrática dentro de los grupos. n= el número de entrevistados en cada grupo (debe ser el mismo).
Comparación múltiple de medias • Paso 1: Construir una tabla de diferencias entre medias ordenadas. (Ver pág. 77). • Paso 2: Encontrar qa en la tabla I. (Primero verificando en la columna los gl, y en los renglones K (el mayor número de medias).
Comparación múltiple de medias • Paso 3: Encontrar la DSH. • Paso 4: Comparar la DSH con la tabla de las diferencias entre medias.
Comparación múltiple de medias • Para que se le considere estadísticamente significativa, cualquier diferencia entre medias debe ser igual o mayor la DSH. • Por lo tanto se concluye las diferencias entre X1 y X3; X2 y X1, son estadísticamente significativas; • No así entre X1 y X2, que solo es de 11.0, menor que 11,08 obtenido en el paso 3.
Comparación múltiple de medias • En tu equipo, analicen el ejemplo y resuelvan un ejercicio asociado (número 5 ó 7). • REALICEN LOS PROBLEMAS DE LAS PÁGINAS: 83-85.