480 likes | 1.04k Views
Explorative und Konfirmatorische Faktorenanalyse. Seminar: Testkonstruktion Dozent: R. Leonhart Referentinnen: M. Albensöder, D. Greiff Albert-Ludwigs-Universität Freiburg Mittwoch, 14.06.2006. Gliederung . Exploratorische Faktorenanalyse (EFA) Konfirmatorische Faktorenanalyse (CFA).
E N D
Explorative und KonfirmatorischeFaktorenanalyse Seminar: Testkonstruktion Dozent: R. Leonhart Referentinnen: M. Albensöder, D. Greiff Albert-Ludwigs-Universität Freiburg Mittwoch, 14.06.2006
Gliederung • Exploratorische Faktorenanalyse (EFA) • Konfirmatorische Faktorenanalyse (CFA)
Exploratorische Faktorenanalyse Wozu: • Datenreduktion • Rückführung von Zusammenhängen auf latente Variablen • Komplexe Merkmalsbereiche homogen untergliedern • Aufwand von Einzelanalysen sehr groß Faktorenanalyse
Exploratorische Faktorenanalyse • „ Ein effektives Verfahren zur Beurteilung vieler einzelner Korrelationen stellt die FA dar, insbesondere dann, wenn man a priori keine Annahmen über die Struktur eines Konstruktes hat.“ (Bühner, S.151) • Ordnung der Items nach korrelativer Ähnlichkeit • Mitbestimmung der vorliegenden Stichprobe • Reproduktion der Testwerte durch latente Variablen • Zusammenhang von Item und Faktoren wird durch Ladungen bestimmt.
Exploratorische Faktorenanalyse Vorgehen: • Grundlegende Annahme: • Modell mehrerer gemeinsamer Faktoren: Xim=fi1*am1+fi2*am2+fi3*am3….+fij*amj+….fiq*amq+ei Wobei: • Xim = Wert einer Person i auf Item m • fi1 = Faktorwert der Person i auf Faktor 1 • am1 = Ladung des Items m auf Faktor 1 • fij =Faktorwert der Person i auf Faktor j • amj =Ladung des Items m auf Faktor j • q = Anzahl der Faktoren • ei = Fehlerkomponente, die durch Faktorenanzahl nicht erklärt werden kann ohne die Fehlerkomponente: Komponentenmodell! „Eigenschaften, Merkmale oder Fähigkeiten einer Person können durch eine Kombination aus gewichteten Faktorwerten und einem Fehler beschrieben werden.“
Exploratorische Faktorenanalyse:Grundbegriffe der FA I • Zuordnung Variable zu Faktor: • i.d.R. Zuweisung zu Faktor, auf dem höchste Ladung • Ladung: • bei orthogonaler Rotation entspricht die Ladung der Korrelation zwischen einem Item und einem Faktor • die quadrierte Ladung daher bei orthogonaler Rotation gemeinsamer Varianzanteil zwischen Faktor und Variable • Einfachstruktur: • bezieht sich auf Struktur der Faktormatrix • liegt vor, wenn Ladungen eines Items auf 1 Faktor sehr hoch und auf restlichen Faktoren sehr niedrig
Exploratorische Faktorenanalyse:Grundbegriffe der FA II • Kommunalität: • die durch alle extrahierten Faktoren aufgeklärte Varianz eines Items (bei orthogonaler Rotation) • ändert sich nicht durch Rotation- entspricht unrotierter Lösung, lediglich Varianzanteile auf den Faktoren ändern sich durch Rotation • Je höher, desto besser durch Faktoren repräsentiert • Mindestschätzung der Reliabilität • Faktorwert: • Wert einer Person auf einem Faktor. Mittelwert Faktor=0 • nur exakt berechenbar bei PCA • Unterscheidung Faktorwert und Summenwert
Exploratorische Faktorenanalyse:Grundbegriffe der FA III • Eigenwert: • aufgeklärte Varianz eines Faktors über alle Items • aufgeklärte Varianz gibt Wichtigkeit des Faktors wieder • sinnvoll: aufgeklärte Varianz vor und nach der Rotation angeben • Fehler: • bezeichnet Messfehler eines Items • Spezifität: • systematische Varianz eines Items, die nicht durch extrahierte Faktoren erklärt wird • Einzigartigkeit: • Varianz des Items, dies mit keinem Testwert geteilt wird
Exploratorische FaktorenanalyseMethoden • Hauptachsenanalyse • Maximum-Likelihood Analyse (ML) • Hauptkomponentenanalyse (aber: nicht Methode im eigentlichen Sinn, dient nur zur Datenreduktion und Itembeschreibung
Exploratorische Faktorenanalyse: Geometrische Modelle • Veranschaulichungshilfe – was geschieht bei FA • Wichtige Räume hierbei: * Personenraum: Die Achsen des Koordinaten- systems stellen hierbei n Versuchspersonen dar, die Punkte m Items * Faktorraum: Hierbei stellen die Achsen q Faktoren und die Punkte m Items dar. Die Items sind dabei mit der Vektorlänge von 1 normiert. Die q Faktoren bilden einen Unterraum des Personenraums!
Exploratorische Faktorenanalyse: Voraussetzung für die Berechnung • Linearität: Beeinflussbar durch: • Ausreißerwerte • Substanzielle Korrelationen • Stichprobengröße und Itemanzahl generell: Stabilität der Faktorlösung steigt mit Stichprobe ↑& Kommunalität / Reliabilität ↑
Exploratorische Faktorenanalyse: Welche Methode passt? • Hauptkomponentenanalyse (Principle Component Analysis-PCA): • Ziel: Datenreduktion • Ausgehend von der Annahme: Varianz eines Items wird vollständig durch Faktoren erklärt, weil Variablen frei von Messfehlern (Kommunalität wird auf 1 gesetzt) • Nach Faktorenextraktion: Varianz = durch Faktoren erklärte V und Restvarianz • Nur Aussagen über Verhältnisse in der Stichprobenkorrelationsmatrix • Normalverteilung und Intervallskalenniveau sind keine Voraussetzung
Exploratorische Faktorenanalyse: Welche Methode passt? • Hauptachsenanalyse (Principle Axis Factor Analysis -PAF): • Ziel: Rückführung von Zusammenhängen zwischen Items auf latente Variablen • analysiert wird die Korrelationsmatrix zwischen den Variablen oder Items • Kommunalitäten sind hier am Anfang die quadrierten multiplen Korrelationen – d.h. nur die Varianz, die Items gegenseitig auklären können. • ist der PCA bei Schätzungen von Ladungen einer Grundgesamtheit überlegen • es wird nur die Varianz faktorisiert, die durch alle anderen Variabeln vorhersagbar ist! • Normalverteilung und Intervallskalenniveau sind keine Voraussetzung
Exploratorische Faktorenanalyse: Welche Methode passt? • Maximum-Likelihood FA (ML) • Schätzung von Faktoren aus der beobachteten Stichproben Korrelationsmatrix, die möglichst viel Varianz in der Grundgesamtheit aufklären • Daten unter Modellannahme betrachtet • Modelltest χ2 –Test entspricht Faktorenstruktur der Datenstruktur • Durchführung mit ausreichend großer Stichprobe, da Populationsparameter geschätzt werden. • alle eingehenden Variablen müssen multivariat-normalverteilt sein!
Exploratorische Faktorenanalyse: Welche Methode passt? • Fazit Methoden: • Bei Normalverteilung und hohen Reliabilitäten und Kommunalitäten der Items kaum Unterschiede! • Reliabilität gilt als guter Schätzer für die Kommunalitäten • Bei einer Festsetzung der Kommunalität auf 1 (PCA) wird die Reliabilität überschätzt, bei quadrierten multiplen Korrelationen kommt es zu einer Mindestschätzung • Ergebnisunterschiede bei explorativer und konfirmatorischer FA v.a. von Methodenwahl abhängig
Exploratorische Faktorenanalyse:Extraktionskriterien I • Problem: kein generell anerkanntes Abbruchkriterium während der Faktorenextraktion • wichtig: inhaltliche Plausibilität • Deshalb: Entwicklung von Methoden, durch die bestimmt werden kann, wie viele Faktoren zu berücksichtigen sind! • Hypothetisches Modell: • Bestimmt durch die Anzahl der Faktoren aus einer Theorie (a priori bekannt und vorgegeben)
Exploratorische Faktorenanalyse:Extraktionskriterien II • Eigenwert >1: • Summe der quadrierten Ladungen über alle Items auf einem Faktor wichtig: inhaltliche Plausibilität • Wichtigkeit eines Faktors • Faktor soll zumindest so viel Varianz aufklären, wie eine einzige Variable • Alle Faktoren, deren Eigenwert größer 1 sind bedeutsam • Scree-Test nach Cattell: • Suche nach einem bedeutsamen Eigenwertabfall • Parallelanalyse nach Horn: • Bildung von Eigenwerten aus normalverteilten Zufallsvariablen • nach versch. Autoren beste Methode
Exploratorische Faktorenanalyse:Rotationstechniken I • es ändert sich nicht die Position des Items im Faktorraum sondern die Art, wie die Items durch die Faktoren beschrieben werden. • i.d.R. soll eine eindeutige Beschreibung der Items durch Faktoren erzielt werden. • daher zumeist Durchführung von Rotationen, die eine Einfachstruktur erzielen sollen. • Fälle möglich, in denen sich die Technik aus den theoretischen Vorstellungen ergibt, z.B. bei a priori Annahmen
Exploratorische Faktorenanalyse:Rotationstechniken II • Orthogonale Rotationstechniken führen zu unkorrelierten Faktoren • Varimax • Quartimax • Equamax • Oblique Rotationstechniken führen zu korrelierten Faktoren • Direct Oblimin • Direct Quartimin • Promax Ausgabe 2er Matrizen: Mustermatrix u. Strukturmatrix
Konfirmatorische Faktorenanalyse (CFA) • Weshalb CFA? • Testung von theoretisch oder empirisch gut fundierter Modelle auf Modellgüte • Basiert auf Weiterentwicklung der FA • Erfassung latenter Variablen und Rückführung der Items (Indikatorvariablen) kausal möglich • Analyse von Kovarianz und Korrelationsmatrizen • Häufig Zusammenfassung mit Pfadanalysen zu „linearen Strukturgleichungsmodellen“ • Im Gegensatz zur EFA keine Datenreduktion angestrebt, sondern nur Testung der Passung
Konfirmatorische FaktorenanalyseUnterschiede • CFA v.a. anzuwenden, wenn theoretisches Vorwissen über das zu testende Modell besteht • nicht alle möglichen Ladungen (wie bei EFA) werden geschätzt, sondern nur die als relevant gesehenen • Unterschied EFA – CFA: bei der EFA werden Ladungen auf dem eigenen als auch auf dem fremden Faktor zugelassen, bei der CFA nur auf einem Faktor!
Konfirmatorische Faktorenanalyse Beispielvorgehen • Spezifizierung eines Modells • Überprüfung der Nullhypothese mit Modelltest (S=K) • Berechnung partieller Regressionsgewichte (Ladungen) und Korrelationen • Modelle ohne latente Variable: Pfadanalyse • Für Modelle ohne mit latenten Variable sehr kompliziert • Grundgleichungen für Modell mit latenter Variable A= a11 * ξ + e1 B= a21 * ξ + e2 a11 σA a: Ladungen e: Fehler σ: Fehlervarianz ξ: latente Variable Item A e1 ξ a21 σB Item B e2
Konfirmatorische FaktorenanalyseSchätzmethoden I • Es stehen unterschiedliche Verfahren zur Parameterschätzung zur Verfügung • Maximum-Likelihood (ML) Wie wahrscheinlich ist das, was ich beobachte, wenn mein Modell gilt? • Generalized Least Squares (GLS) • Unweighted Least Squares (ULS) Methoden minimieren die quadrierten Abweichungen zwischen beobachteter u. durch das Modell festgelegter Korrelations- o. Kovarianzmatrix • Asymptotically Distribution-Free (ADF) basierend auf einer speziellen Varianz-, Kovarianz u.GLS Schätzung
Konfirmatorische FaktorenanalyseSchätzmethoden II • Auswahl der Schätzmethode abhängig von: • Skalenqualität (ordinal – oder intervallskaliert) • Art der Verteilung (normal vs. schief) • Stichprobengröße • Voraussetzung für ML und GLS • multivariate Normalverteilung und Intervalldatenniveau • auch bei geringer Stichprobengröße (N<100) möglich • ADF nur bei extrem großen Stichproben, setzt aber formal keine Verteilungsannahmen voraus!!!
Konfirmatorische FaktorenanalyseModelltestung I • Exakter Modell-Fit: • χ² -Test mit folgenden Hypothesen: H0: Das Modell passt zur Datenstruktur (DS) H1: Das Modell weicht von der DS ab. • Auswirkungen der Stichprobengröße • Achtung: Annahme der Nullhypothese sprich nicht dafür, dass das Modell das „wahre Modell“ ist!!
Konfirmatorische FaktorenanalyseModelltestung II • Approximativer Modell-Fit: Fit Indizes • Viele Fit-Indizes – können u.U. trotz großer Stichprobe stark variieren. • Prüfen: Abweichung von einem • Null-Model • „Independence Modell“ • „fully saturated „Modell • Generell 2 Klassen von Fit-Indizes • Absolute Fit-Indizes • inkrementelle Fit-Indizes / komparative Fit-Indizes
Konfirmatorische FaktorenanalyseVoraussetzungen • Kovarianzen oder Korrelationen • Verteilungen • Linearität • Kollinearität • Stichprobengröße • Anzahl von Indikatoren pro latenter Variable • Identifikation (unteridentifiziert, gerade identifiziert und überidentifiziert
Konfirmatorische FaktorenanalyseTesttheoretische Einbettung • CFA: Prüfung, ob Antworten oder Reaktionen von Personen in einer vorher spezifizierten Art einer latenten Variable zugeordnet werden können. • Prüfung mit Signifikanztest und Modellgüteindizes • Bedeutung für die Reliabilitätsberechnung • Korrelierte Fehlervarianzen • Minderungskorrigierte Korrelationen • Zusammenfassung von Variablen oder Items • Äquivalenz von Messungen • Multi-Trait-Multi-Method-Ansatz
Konfirmatorische Faktorenanalyse • Worauf muss ich besonders achten? • genügend Items mit guten psychometrischen Eigenschaften • gefährlich: sehr viele Pfade/Korrelationen/Kovarianzen sind anhand von Modifikationsindizes spezifiziert, so dass perfekter Modell-Fit – wenig aussagekräftig, wenn inhaltlich nicht gut begründbar • Verteilungen vor Durchführung CFA inspizieren • Interpretation mit mindestens 2 Fit-Indizes • Guter Fit ergibt nur Aussage über die Modellübereinstimmung mit beobachteten Daten- sagt nichts über dessen Gültigkeit, außer Validitätskriterien fließen mit ein.