280 likes | 507 Views
Faktorenanalyse. explorative vs. konfirmatorische Faktorenanalyse. Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen (Schleifen) wird nach der besten Lösung gesucht.
E N D
explorative vs. konfirmatorische Faktorenanalyse • Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen (Schleifen) wird nach der besten Lösung gesucht. • Konfirmatorische FA überprüfen, ob empirisch erhobene Daten ein bestehendes theoretisches Modell bestätigen oder verwerfen. Alternativ kann eine explorative FA an einer anderen Stichprobe „kreuzvalidiert“ werden.
Faktorenanalyse: Was und wozu? • Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.B. Fragebogenitems) untersucht werden. • Die Faktorenanalyse führt zu einer Datenreduktion: Die Variation in einer Vielzahl von Variablen wird auf eine geringere Zahl von gemeinsamen Faktoren zurückgeführt.
Exploratorische Faktorenanalyse • Bei einer exploratorischen Faktorenanalyse existieren im „Idealfall“ keine Annahmen darüber, wie viele Faktoren den Variablen zugrunde liegen und welche Struktur die Zusammenhänge zwischen den Variablen haben. • In der Praxis ist das natürlich fast nie der Fall; z.B. vermuten wir vorab, dass unseren Fragebögen nur eine einzige latente Dimension zugrunde liegt.
Exploratorische Faktorenanalyse • Im Rahmen der exploratorischen Faktorenanalyse gehen wir, der Natur der Methode entsprechend, trotzdem „naiv“ vor. Die Fragen, welche am Ende der Analyse beantwortet sein sollen, sind: • Wie viele Faktoren sind angemessen, um die Zusammenhänge zwischen den untersuchten Variablen zu erklären? • Welche der Faktoren beeinflussen welche meiner Variablen?
Faktorenanalyse im Bild Items: manifest (eckig) Faktoren: latent (rund)
Voraussetzungen der Faktorenanalyse • intervallskalierte Variablen • normalverteilte Variablen • n pro Variable mindestens 3 • substanzielle Korrelationen im Datensatz • dichotome Variablen (0/1) mit Einschränkungen verwendbar
Wesentliche Konzepte der Faktorenanalyse: Faktor • viele Variablen werden durch wenige Faktoren ersetzt • ein Faktor enthält die Information mehrerer Variablen • Faktor: theoretische Variable oder Konstrukt, das allen wechselseitig hoch korrelierenden Variablen zu Grundeliegt • Ergebnis der Faktorenanalyse: wechselseitig voneinander unabhängige Faktoren, die die Zusammenhänge zwischen den Variablen beschreiben oder erklären
Wesentliche Konzepte der Faktorenanalyse: Faktorladung • Korrelation einer Variablen mit einem Faktor • Wertebereich: -1 bis +1 • „Variable lädt hoch oder niedrig auf diesem Faktor“ • über die Faktorladungen wird definiert, welche Variable zu welchem Faktor „gehört“ und damit auch, was jeder Faktor bedeutet
Wesentliche Konzepte der Faktorenanalyse: Kommunalität • Die Kommunalität einer Variablen gibt an, in welchem Ausmaß die Varianz dieser Variablen durch die Faktoren erfasst / erklärt / aufgeklärt wird. • Summe der quadrierten Ladungen einer Variablen über alle Faktoren • Maximum: 1 (da die Gesamtvarianz jeder Variablen auf 1normiert ist)
wesentliche Konzepte der Faktorenanalyse: Faktorwert • kennzeichnet die Position einer Person auf einem Faktor • Wertebereich: standardisierte Werte mitM = 0, s = 1 (pro Faktor). • Wie sehr weist eine Person die Eigenschaften des Faktors auf?
Wesentliche Konzepte der Faktorenanalyse: Eigenwert Faktor • gibt an, wie viel von der Gesamtvarianz aller Variablen durch diesen Faktor erklärt wird • Summe der quadrierten Ladungen aller Variablen auf diesem Faktor • 0 - Max: (entspricht der Anzahl an Variablen)
Schematische Veranschaulichung der Beziehungen von Faktorladungen, Kommunalitäten und Eigenwerten anhand des Ladungsmusters von vier Variablen auf zwei Faktoren. Ladungsmatrix A
Fundamentaltheorem der Faktorenanalyse • Ein beobachteter (standardisierter) Wert zij einer Person i in Variable j kann in eine Linearkombination aus den mit den Faktorladungen akj gewichteten Faktorwerten fik und einer Fehlerkomponente eij zerlegt werden. • Gleichung für Person i: zij=aj fi+aj fi2+ajk fik+...+ajq fiq+eij • zij = der Wert der Person i in der beobachteten Variablen j; • ajk = Ladung der Variablen j auf Faktor k; • fik= Faktorwert der Person i in Faktor k; • eij = durch die Faktoren nicht erklärte Fehlerkomponente; • q = Anzahl der Faktoren (k = 1, …, q)
Faktorenextraktion • Die Faktorenextraktion erfolgt nach dem Kriterium, dass jeder Faktor sukzessiv so viel Varianz in den untersuchten Variablen erklärt wie möglich. • Jeder neue Faktor erklärt dabei nur Varianz, die von den zuvor extrahierten Faktoren nicht erklärt wurde. • Zur Faktorenextraktion stehen verschiedene Verfahren zur Verfügung. Die beiden bedeutendsten sind die Hauptkomponentenanalyse (principal components analysis, PCA) und die Hauptachsenanalyse (principal axes factor analysis, PFA). • Beide Verfahren unterscheiden sich vor allem hinsichtlich der Annahmen bezüglich der durch die Faktoren in den Variablen erklärbaren Varianz.
Bestimmung der Faktorzahl I • Kaiser-Guttman-Regel (Eigenwertkriterium) • Alle Faktoren mit einem Eigenwert größer 1 werden aufgenommen. • Somit erklärt ein Faktor immer mehr Varianz als eine ursprüngliche Variable.
Bestimmung der Faktorzahl II • Kriterium der extrahierten Varianz • Durch Vorüberlegungen kann festgelegt werden, wie groß der Anteil der extrahierten Varianz durch die aufgenommenen Faktoren sein soll.
3 Faktoren klären über 50% der Merkmals-varianz auf. Kaiser-Guttman Kriterium 10 Faktoren klären über 90% der Merkmalsvarianz auf. Eigenwerte
Bestimmung der Faktorzahl III • Screeplot • Über den „Knick“ im Verlauf der Eigenwerte wird entschieden, wie viele Faktoren extrahiert werden. • Im Beispiel würde man sich für 2 Faktoren entscheiden.
Das Rotationsproblem • Die Position der Faktoren ist zunächst nach Maximierung der Varianzaufklärung gewählt. • Nach Bestimmung von Zahl (und Lage) der Faktoren ist eine Rotation um den Ursprung ohne Informationsverlust möglich. • Ziel: Einfachstruktur, d.h. hohe Ladung der Faktoren auf einigen Variablen, niedrige auf den anderen.
Vor der Rotation • Variablen sind nur schwer zuzuordnen
Nach der Rotation • Problem der Zuordnung nur noch bei der Variablen Leistungsbereitschaft
Rotationsvarianten Orthogonale Rotation: Die Faktoren werden rechtwinklig rotiert. Vorteil: Faktoren sind voneinander unabhängig. Oblique Rotation: Die Faktoren werden schiefwinklig rotiert. Vorteil: Über die Faktoren kann eine Faktorenanalyse zweiter Ordnung berechnet werden.
Faktorenrotation Gebräuchliche orthogonale Rotationstechniken • Varimax: Maximiert die Varianz der quadrierten Faktorladungen innerhalb der Faktoren. Varimax ist der am häufigsten verwendete orthogonale Rotationsalgorithmus. • Quartimax: Maximiert die Summe der vierten Potenz aller Faktorladungen. Es wird angestrebt, einen Faktor mit vielen hohen und mittleren Ladungen sowie verbleibende Faktoren mit wenigen hohen und sonst niedrigen Ladungen zu erhalten. Dieses Verfahren kann angezeigt sein, wenn ein gemeinsamer Generalfaktor erwartet wird.
Faktorenrotation Gebräuchliche oblique Rotationstechniken • Promax: Dieser Algorithmus startet mit einer orthogonalen Rotation und transformiert die Faktoren anschließend in eine oblique Lösung mit dem Ziel, die absoluten Werte der Primärladungen zu maximieren und die Sekundärladungen gegen Null gehen zu lassen • Direct Oblimin: Ein Rotationsalgorithmus, der die simultane Optimierung eines orthogonalen und eines obliquen Rotationskriteriums anstrebt. • Bei beiden obliquen Rotationsverfahren kann die Höhe der Faktorinterkorrelationen vom Benutzer beeinflusst werden.
Interpretation der Faktoren • Die berechneten Faktoren müssen inhaltlich interpretiert werden. • Die Faktorenanalyse bietet die Faktorladungen der Variablen an, kann Faktoren aber nicht benennen oder interpretieren.
Formen der FA • „Kommunalitätsproblem“: Wie viel Varianz von jeder Variablen wird zu Beginn der FA aufgeklärt, also bevor die endgültige Lage der Faktoren bekannt ist? • Wenn die Variable selbst als Faktor berücksichtigt wird: 100%h² = 1 • Wenn nur die anderen Variablen berücksichtigt werden: wenigerh² < 1 • Bei der Hauptkomponentenanalyse (PCA = Principal Component Analysis) wird zu Beginn des Optimierungsprozesses eine Kommunalität von 1 angenommen. • Bei der Hauptachsenanalyse wird zu Beginn des Optimierungsprozesses die Kommunalität für jede Variable geschätzt
Zusammenfassung • Kommunalitäten: Summe der quadrierten Korrelationen einer Variable mit allen Faktoren; Prozentsatz der durch alle Faktoren beschriebenen Varianz einer Variablen • Faktorladungen: Korrelation einer Variablen mit einem Faktor • Faktorwerte: Kennzeichnet die Ausprägung eines Faktors für eine Person • Eigenwert: Gesamtvarianz aller Variablen, die durch den Faktor aufgeklärt wird