E N D
(Benninghaus S 344-367) Varianzanalyse: Verfahren, um den Zusammenhang zwischen einer intervallskalierten abhängigen und einer beliebig (meist nominal, mit wenigen Kategorien) skalierten unabhängigen Variablen zu ermitteln. Anders formuliert: Es geht um die Unterschiede in einer AV zwischen Gruppen von Untersuchungseinheiten, z.B. Unterschied im Einkommen zwischen Männern und Frauen Eta ist das Maß für den Zusammenhang zwischen UV und AV, Eta² ist der Anteil der erklärten Varianz an der Gesamtvarianz bzw. die proportionale Fehlerreduktion Eta setzt keine Linearität des Zusammenhangs voraus (macht bei nominalskalierten Variablen auch keinen Sinn) ist ein Maß für asymmetrische Hypothesen: es wird zwischen unabhängiger und abhängiger Variable unterschieden Varianzanalyse und Eta²
Theoretisch kann man Eta auch für 2 intervallskalierte Variablen verwenden, indem man die UV in wenige Kategorien klassifiziert. Das ist allerdings meist wenig sinnvoll, weil Eta mit der Anzahl der Kategorien schwankt (je mehr Kategorien, desto größer Eta). Ein solches Verfahren ist nur bei nicht-linearen Zusammenhängen sinnvoll. In dem Fall gibt es theoretisch 2 Etas, je nachdem, welches die AV ist. Eta ist immer größer als die Korrelation r, weil Eta auch die nicht-linearen Anteile von Zusammenhängen berücksichtigt. Im Unterschied zur Korrelation ist Eta vorzeichenlos und reicht von 0 bis 1. Varianzanalyse und Eta²
AV . .. . …. … .. ….. . …. 1 2 UV graphische Veranschaulichung
Erläuterung der proportionalen Fehlerreduktion (PRE) • Ohne Kenntnis der UV sagen wir für jede Untersuchungseinheit bei der Variable y den Mittelwert y quer vorher. • Der Fehler, den wir dabei machen, ist die Summe aller quadrierten Abweichungen der Messwerte aller Untersuchungseinheiten vom Mittelwert y quer (Gesamtvariation)
Erläuterung der proportionalen Fehlerreduktion (PRE) • Mit Kenntnis der UV sagen wir für jede Untersuchungseinheit bei der Variable y den Mittelwert der entsprechenden Kategorie der UV vorher. • Der Fehler, den wir dabei machen, ist die Summe aller quadrierten Abweichungen der Messwerte aller Untersuchungseinheiten von dem Mittelwert in der Kategorie der UV (nicht erklärte Variation)
Erläuterung der proportionalen Fehlerreduktion (PRE) • Erklärte Variation dagegen sind die quadrierten Abweichungen der Kategorienmittelwerte vom Gesamtmittelwert y quer
Erläuterung der proportionalen Fehlerreduktion (PRE) • Varianzzerlegung: Die Gesamtvariation ist die Summe der erklärten und nicht erklärten Variation. Die Gesamtvarianz ist die Summe der erklärten und der nicht erklärten Varianz:
Erläuterung der proportionalen Fehlerreduktion (PRE) • Variationszerlegung bei R² (zur Erinnerung) • Variationszerlegung bei Eta² gesamte erklärte nicht erklärte Variation
Erläuterung der proportionalen Fehlerreduktion (PRE) • Fehlerreduktion (E1-E2) / E1 • (Gesamtvariarion – nicht erklärte Variation)geteilt durch Gesamtvariation • identisch mit erklärte Variation durch Gesamtvariation • man erhält die gleichen Werte, wenn man statt der Variation die Varianz verwendet
Erläuterung der proportionalen Fehlerreduktion (PRE) • Fehlerreduktion (E1-E2) / E1
Interpretation • Interpretation Eta: das Maß für den Zusammenhang zwischen beiden Variablen • Interpretation Eta²: der Anteil der durch x erklärten Varianz von y an der Gesamtvarianz von y (damit ist aber noch keine kausale Aussage verknüpft) • oder: Proportionale Fehlerreduktion: Um wie viel sinkt der Fehler bei der Vorhersage der AV, wenn man die UV kennt? • Wenn Eta² = .20 ist, sinkt der Vorhersagefehler um 20 Prozent.