20 likes | 259 Views
Multinomial logistische Regression. Am Beispiel des Datensatzes zur Kommunalwahl 2002. Methode Ziel ist es über einen Regressionsansatz die Eintrittswahrscheinlichkeiten von kategorialen Ereignissen in Abhängigkeit von verschiedenen Einflußgrößen zu bestimmen.
E N D
Multinomial logistische Regression Am Beispiel des Datensatzes zur Kommunalwahl 2002 • Methode • Ziel ist es über einen Regressionsansatz die Eintrittswahrscheinlichkeiten von kategorialen Ereignissen in Abhängigkeit von verschiedenen Einflußgrößen zu bestimmen. • Im Unterschied zur linearen Einfachregression werden hier folglich keine Je-desto Hypothesen zwischen den unabhängigen und der abhängigen Variable formuliert, sondern zwischen den unabhängigen Variablen und der Eintrittswahrscheinlichkeit für ein Ereignis. • Die Ähnlichkeit zur Diskriminanzanalyse wird bei Betrachtung der Gütemaße deutlich: so gibt der Log-Likelihood Quotient darüber Aufschluss, wie gut die unabhängigen Variablen zur Trennung der Ausprägungskategorien von Y beitragen. Gütemaße auf der Modellebene sind abhängig von der Anzahl der Kovariatenmuster. Der Ansatz der multinomialen Regression • Voraussetzungen • Unabhängige Variablen sollten frei von Multikollinearität sein • Es sollte keine Autokorrelation zwischen vorliegen • Die Fallzahl sollte pro Gruppe (=Ausprägung der abhängigen Variable) nicht kleiner als 25 sein. • Die abhängige Variable ist kategorial verteilt. • Die unabhängigen Variablen können sowohl kategorial, als auch metrisch skaliert sein (in SPSS: Faktoren) [p(Gruppe1) p(Gruppe2)] ln CSU SPD [p(Gruppe2) p(Gruppe3)] p[(Gruppe1) p(Gruppe3)] ln andere Partei ln Quelle:Backhaus 2005:Multivariate Analysemethoden.11.Aufl.,Berlin.Springer • Datensatz • CATI-Befragung des Lehrstuhls bezüglich Einstellung der Nürnberger Bürger zur Kommunalwahl 2002 (Herbst 2002) • Forschungsfrage • Welchen Einfluß hatten bestimmte unabhängige Variablen auf die Wahlentscheidung der Nürnberger Bürger vor der Kommunalwahl 2002? . , `. Ergebnisse 1.Neben der politischen Prädisposition und dem Alter, erweist sich vor allem der sozio-ökonomische Status der Befragten als Variable mit stärkster Trennkraft zwischen den Gruppen. 2.Interpretation: erhöht sich z.B. der Score in der Variable Sozio-ökonomischer Status (Ses) um eine Einheit, verändert sich das Chancenverhältnis einer Wahlentscheidung SPD/andere Partei oder Stimmenthaltung von 1:1, auf (0,6592):1 [odds ratios]. 3. „Nur“ 37,9% der Varianz bezüglich der Parteienpräferenz lassen sich auf die 5 Variablen zurückführen. ---> Im Vergleich zur Diskriminanzanalyse ist die multinomiale Regression das robustere Verfahren. Plakat vorgestellt von Michael Zochowski im Rahmen des FoKo “Multivariate Datenanalyse” [Wittenberg, WS 05/06] am 11.02.2006