1.42k likes | 2.69k Views
Introducción al Análisis factorial confirmatorio. Lectura básica: Cap. 13 del texto Ampliación: Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research . New York: The Guilford Press. Programas: LISREL, AMOS, EQS, Mplus. 1.) AFE versus AFC 2.) Aplicaciones.
E N D
Introducción alAnálisis factorial confirmatorio Lectura básica: Cap. 13 del texto Ampliación: Brown, T. A. (2006). Confirmatory Factor Analysis for Applied Research. New York: The Guilford Press. Programas: LISREL, AMOS, EQS, Mplus
1.) AFE versus AFC 2.) Aplicaciones
Minimizar diferencias entre la matriz de correlaciones observada y la reproducida MUCHAS SOLUCIONES POSIBLES 1 factor? 2 factores? 3 factores?
REPRESENTACIÓN: z6 z5 z4 z2 z3 z1 Modelo exploratorio Cuantos factores? Criterio para la Rotación? E1 F1 E2 E3 E4 F2 E5 E6 DATOS MODELO
z3 z1 z2 z4 z5 z6 Modelo confirmatorio E1 F1 E2 E3 E4 F2 E5 E6 rF1F2=0.631 MODELODATOS
z3 z1 z2 z4 z5 z6 E1 Modelo exploratorio: Modelo inicial F1 E2 E3 E4 F2 E5 E6 rF1F2= 0 DATOSMODELO
AFE versus AFC Similitudes • Técnica de reducción de dimensionalidad: Se buscan (pocos) factores comunes que expliquen la matriz de var-cov, S. • Muchos procedimientos (p.e., de estimación) son comunes a AFE y AFC. Diferencias • No explora la relación entre variables o constructos, sino que las contrasta: • Se supone un número concreto de factores comunes y qué variables empíricas (indicadores) los miden. • Se supone la existencia o no de relación entre los factores. • Se pueden establecer correlaciones entre los términos de error. • No es necesario un método de rotación.
Ventajas del modelo confirmatorio (I) Permite evaluar el ajuste estadístico de nuestros modelos teóricos… fijando: • Número de factores • Ítems que saturan en cada factor • Especificando errores de medida correlacionados
E1 E1 F1 F1 E2 E2 E3 E3 E4 E4 F2 F2 E5 E5 E6 E6 x4 x6 x6 x5 x3 x4 x1 x2 x1 x5 x3 x2 Ventajas del modelo confirmatorio (II) = Grupo 1 Grupo 2 -Contraste de hipótesis de invarianza de parámetros a través de sexo, país, nivel educativo,… (tests óítems –DIF-) - Análisis de las estructuras de medias
Ventajas del modelo confirmatorio (III) Modelo confirmatorio Modelos complejos: Análisis factorial de 2º orden, modelos con errores correlacionados
Ventajas del modelo confirmatorio (Iv) • Obtención de la correlación entre constructos (similar a la corrección por atenuación). Validación de constructo, mostrando la validez convergente de los indicadores que se espera que estén asociados, y la discriminante (no correlación de los que se espera que no correlacionen).
Ventajas del modelo confirmatorio (V) • Tratamiento de los efectos de método: por ejemplo, los ítems directos e inversos en los cuestionarios. En AFE salen como factores espúreos, no sustantivos.
Ventajas del modelo confirmatorio (VI) • Evaluación psicométrica de tests: - Enfoque alternativo a TRI… análisis factorial para datos categóricos • Modelo logístico de 2 parámetros • Modelo de respuesta graduada. • modelos multidimensionales de TRI… - Nuevas medidas de fiabilidad…
Representación de modelos Se representan mediante “diagramas causales” o “path diagrams”: Tipos de variables: OBSERVABLES: LATENTES: Muy importante el concepto de factor latente! x1 x1 F1 x2 x3
Tipos de relaciones (siempre lineales): FLECHAS BIDIRECCIONALES: Covarianzas o correlaciones FLECHAS UNIDIRECCIONALES: Pesos no estandarizados o pesos estandarizados x1 E1 E2 x2 x1 F1
EXOGENAS: Variables que el modelo NO intenta explicar (ninguna flecha las apunta) ENDOGENAS: Variables que en el modelo se intentan explicar. Toda variable endogena tiene un error. e1 x1 F1 x2 e2 x3 e3
Objetivo cuando se genera un modelo confirmatorio: • Generar un modelo que sea compatible con la matriz de varianzas-covarianzas entre todas las variables. • Las varianzas y covarianzas son función de los parámetros del modelo.
Ingredientes del modelo Para especificar el modelo, hay que fijar: • Número de factores comunes. 2) Relaciones entre las xs y los factores comunes. 3) Si existe o no covariación entre los factores comunes (y entre cuales). 4) Si existe o no covariación entre los factores únicos (y entre cuales).
e12 e1 1 x1 λ11 F12 e22 λ21 e2 F1 1 x2 λ31 e32 λ41 e3 x3 1 e42 e4 x4 1 Análisis Factorial (1 factor) Ecuaciones: Modelo: Matriz de varianzas-covarianzas reproducida
Análisis Factorial (1 factor)
e12 e1 1 x1 λ11 F12 e22 λ21 e2 F1 1 x2 λ31 e32 λ41 e3 x3 1 e42 e4 x4 1 Path analysis (Análisis de Senderos)
Análisis Factorial (1 factor)
e12 e1 1 x1 λ11 F12 e22 λ21 e2 F1 1 x2 λ31 e32 λ41 e3 x3 1 e42 e4 x4 1 Path analysis (Análisis de Senderos)
Ecuaciones… e incognitas Infinitas soluciones Identificación… Ajuste…. x+u=1 y+v=1 x*y=0.24 ----- x+u=1 y+v=1 z+w=1 x*y=0.25 z*y=0.24 z*x=0.24 ----- x+u=1 y+v=1 z+w=1 t+r=1 x*y=0.25 z*y=0.24 z*x=0.24 t*x=0 t*y=0 t*z=0
¿es estimable el modelo? Datos o ecuaciones disponibles (p(p+1)/2) Elementos de la matriz de varianzas-covarianzas Parámetros a estimar (t): 10 ecuaciones 9 parámetros Parámetros del modelo: t - Pesos libres entre las variables exógenas y las endogenas - Varianzas/covarianzas entre las variables exógenas • No son parámetros del modelo: • Varianzas y Covarianzas de las variables endógenas
e12 e1 1 x1 λ11 F12 e22 λ21 e2 F1 1 x2 λ31 e32 λ41 e3 x3 1 e42 e4 x4 1 Análisis Factorial (1 factor) Modelo: Restricciones: - Fijar un peso factorial a 1 - Fijar la varianza del factor a 1 Matriz de varianzas-covarianzas reproducida
¿es estimable el modelo? Datos o ecuaciones disponibles (p(p+1)/2) Elementos de la matriz de varianzas-covarianzas: 10 Parámetros a estimar (t): 8 Grados de libertad: 2 Gl=(p(p+1)/2)-t < 0: Modelo no identificado, hay más incógnitas que ecuaciones 0: Modelo saturado o exactamente identificado. Solución única. Reproduce exactamente la matriz de varianzas-covarianzas >0: Modelo sobreidentificado. Si hay más ecuaciones que incógnitas no hay una solución exacta. Buscaremos aquella solución que haga lo más parecidas posibles la matriz de varianzas-covarianzas observada y la reproducida.
SINTAXIS MPLUS (MATRIZ DE VARIANZAS-COVARIANZAS)
Parámetros obtenidos (sin estandarizar): 84 e1 1 x1 1 16 84 1 e2 F1 1 x2 .1.5 64 1.75 e3 x3 1 51 e4 x4 1
RESULTADOS MPLUS Significación estadística MODEL RESULTS Estimates S.E. Est./S.E. Std(**) StdYX(*) F BY X1 1.000 0.000 0.000 4.000 0.400 X2 1.000 0.417 2.398 4.000 0.400 X3 1.500 0.536 2.799 6.000 0.600 X4 1.750 0.640 2.734 7.000 0.700 Variances F 16.000 9.707 1.648 1.000 1.000 Residual Variances X1 84.000 13.285 6.323 84.006 0.840 X2 84.000 13.285 6.323 83.999 0.840 X3 64.000 14.206 4.505 63.995 0.640 X4 51.000 16.272 3.135 51.010 0.510 - Coeficientes de la ecuación de regresión (cambios de x en función de cambios en F). Por ejemplo, 4 puntos de cambio en F (una DT) llevan a 4 puntos de cambio en X1. - Varianza de los errores de pronóstico. La varianza de X1 es 100 (en la población general). Sin embargo, para gente igualada en F la varianza de X1 es 84.
Matriz de varianzas-covarianzas reproducida REPRODUCIDA SEGÚN LOS PARÁMETROS DEL MODELO OBSERVADA RESIDUOS (observada – estimada)
RESULTADOS MPLUS: Correlaciones (si las variables exógenas son independientes) unicidades MODEL RESULTS Estimates S.E. Est./S.E. Std(**) StdYX(*) F BY X1 1.000 0.000 0.000 4.000 0.400 X2 1.000 0.417 2.398 4.000 0.400 X3 1.500 0.536 2.799 6.000 0.600 X4 1.750 0.640 2.734 7.000 0.700 Variances F 16.000 9.707 1.648 1.000 1.000 Residual Variances X1 84.000 13.285 6.323 84.000 0.840 X2 84.000 13.285 6.323 84.000 0.840 X3 64.000 14.206 4.505 64.000 0.640 X4 51.000 16.272 3.135 51.000 0.510 - Coeficientes de la ecuación de regresión estandarizados - Varianza de los errores de pronóstico (unicidades)
Parámetros obtenidos (sin estandarizar): .84 e1 1 x1 .4 1 .84 .4 e2 F1 1 z2 .6 .64 .7 e3 x3 1 .51 e4 z4 1 Parámetros obtenidos (estandarizados): Para obtener el parámetro estandarizado se multiplica por la desviación típica de la variable exógena y se divide por la desviación típica de la variable endogena 40
Matriz de correlaciones reproducida REPRODUCIDA SEGÚN LOS PARÁMETROS DEL MODELO OBSERVADA RESIDUOS
x1 e1 ξ1 x2 e2 Modelo no identificado p q Con dos indicadores, 3 datos: las dos varianzas y la covarianza. En el ejemplo habría que estimar: 1 lambda (la otra se fija una a 1, para fijar la escala), la varianza del factor común, las varianzas de los 2 factores únicos (la covarianza entre ellos se ha fijado a cero) (4 parámetros). Luego gl = -1. 0.24=p*q
p q r s 10-9=1 p q 10-8=2
Puede ocurrir que los grados de libertad no sean negativos y, sin embargo, que el modelo no tenga solución: • Falta de Falta de identificación identificación parcial empírica p p q q z 10-8=2 10-9=1
Modelo en ecuaciones (2 factores) 1 e1 x1 λ11 1 λ21 x2 e2 ξ1 λ31 1 λ32 x3 e3 λ42 1 x4 e4 ξ2 λ52 1 x5 e5
Pesos factoriales Varianzas-Covarianzas entre factores latentes Varianzas-Covarianzas teóricas Varianzas-Covarianzas entre errores
e1 x1 x2 e2 ξ1 x3 e3 x4 e4 ξ2 x5 e5 48
e1 x1 x2 e2 ξ1 x3 e3 x4 e4 ξ2 x5 e5 49
e1 x1 x2 e2 ξ1 x3 e3 x4 e4 ξ2 x5 e5 50