280 likes | 345 Views
Covariance analysis combines variance and regression analysis, reducing error variance of ANOVA to increase statistical power. Learn its theoretical process, practical application, and calculations in SPSS.
E N D
Kovarianzanalyse Kovarianzanalyse • Störvariablen • Veranschaulichung der Kovarianzanalyse • Quadratsummen und „modifizierte“ Quadratsummen • F-Test • Reduktion der Fehlervarianz • Voraussetzungen • Die Kovarianzanalyse in SPSS 09_ancova1
Kovarianzanalyse Kovarianzanalyse • Die Kovarianzanalyse ist ein Verfahren, das eine Varianzanalyse mit einer Regressionsanalyse kombiniert. • Die Kovarianzanalyse wird eingesetzt, um die Fehlervarianz einer ANOVA zu verringern und damit die Power zu erhöhen. • Dazu wird der Einfluss einer zusätzlichen Variable aus der AV einer Varianzanalyse „herauspartialisiert“. • Beispiel: Vor dem Vergleich der Gedächtnisleistung (AV) zwischen zwei Lernbedingungen (UV) wird der Einfluss des Alters (Kovariate) heraus gerechnet. 09_ancova 2
Störvariablen Statistische Kontrolle von Störvariablen Beispiel: Untersuchung zum Therapieerfolg • Faktor Geschlecht des Patienten (2-fach) • Faktor Therapieform (3-fach) Es werden ungefähr 2 x 3 x 20 = 120 Vpn benötigt. • Wenn das Alter (Störvariable) als dritter Faktor (z.B. drei Stufen) berücksichtigt werden soll, braucht man schon 3 x 120 = 360 Vpn. • Weil ein solches Vorgehen wenig ökonomisch wäre, ist eine statistische Kontrolle des Alters vorzuziehen Kovarianzanalyse 09_ancova 3
Veranschaulichung der Kovarianzanalyse Theoretisches Vorgehen bei der Kovarianzanalyse: • Ziel: Statistische Kontrolle einer (Stör-) Variablen, die möglicherweise die Daten der Untersuchung beeinflusst haben könnte: • Frage: Wie sähen die Ergebnisse aus, wenn die Kovariate in allen Gruppen gleich gewesen wäre? • (Theoretisches) Vorgehen: 1. Die Störvariable wird zusätzlich erhoben 2. Ihr Einfluss wird mit eine Kovarianzanalyse „neutralisiert“ 09_ancova 4
Veranschaulichung der Kovarianzanalyse Theoretisches Vorgehen bei der Kovarianzanalyse: • Eine Regressionsanalyse „entfernt“ die Varianz der Kovariate aus der abhängigen Variablen (AV). • Dies geschieht, indem eine Regression der AV auf die Kovariate berechnet wird. • Die Regressionsresiduen beschreiben den Anteil der AV, der nicht durch die Kovariate erklärt werden kann. • Diese Residuen werden als neue AV in eine Varianzanalyse gegeben Die nach der Regressionsanalyse verbleibende (nicht erklärbare) Varianz mit der Hilfe einer ANOVA erklärt. 09_ancova 5
Veranschaulichung der Kovarianzanalyse Regression • Residuum= nicht durch Prädiktor (x) vorhersagbarer „Rest“ des Kriteriums (y). • Varianz der Residuen (Streuung der Datenpunkte um die Regressionsgerade) = nicht vorhergesagte (erklärte) Varianz 09_ancova 6
Veranschaulichung der Kovarianzanalyse Beispiel • 20 Schüler lernen eine Programmiersprache. • UV: 5 verschiedene Lernmethoden • AV: Lernerfolg • Kovariate: mathematische Vorkenntnisse Der Einfluss der Kovariate auf den Lernerfolg wird statistisch kontrolliert. Der Effekt der Lehrmethode kann so auch zuverlässig bestimmt werden, wenn zufällig in einer Gruppe viele Probanden mit hohen Vorkenntnissen waren. 09_ancova 7
Veranschaulichung der Kovarianzanalyse Daten x: mathematisch-logische Fähigkeiten (Kovariate)y: Lernerfolg (AV) 09_ancova 8
Veranschaulichung der Kovarianzanalyse 1. Schritt: Regression von y auf x 09_ancova 9
Veranschaulichung der Kovarianzanalyse 2. Schritt: Bestimmung der Residuen Wie kann man die Residuen interpretieren? Das Residuum gibt an wie gut eine Person im Vergleich mit anderen Personen, die die gleichen Vorkenntnisse hatten, abgeschnitten hat. Bsp. Vp 1: Die Person schneidet für ihre Vorkenntnisse ungefähr durchschnittlich ab. Bsp. Vp 2: Die Person hat ein deutlich negatives Residuum obwohl sie fast den gleichen Testwert hatte: Für ihre guten Vorkenntnisse hat sie ein eher schlechtes Ergebnis erreicht. 09_ancova 10
Veranschaulichung der Kovarianzanalyse 3. Schritt: ANOVA mit den Residuen Die ANOVA wird wie immer berechnet: • Quadratsummen (between & within) • Mittlere Quadratsummen • F-Werte • … 09_ancova 11
Tatsächliche Berechnung der Kovarianzanalyse • Tatsächlich erfolgt die Berechnung nicht genau wie das gerade veranschaulicht wurde! • Stattdessen wird die Varianz der Kovariate wird direkt aus den Quadratsummen „entfernt“. • Das mathematische Vorgehen ist folgendes: • Quadratsummenzerlegung beider Variablen • Produktsummenzerlegung • Entfernen der Varianz der Kovariate: Berechnen der Modifizierten Quadratsummen • F-Test 09_ancova 12
Tatsächliche Berechnung der Kovarianzanalyse 1. Quadratsummen • Quadratsummenzerlegung für die AV (y) und die Kovariate (x) 09_ancova 13
Tatsächliche Berechnung der Kovarianzanalyse 1. Quadratsummen 09_ancova 14
Tatsächliche Berechnung der Kovarianzanalyse 2. Produktsummen • Die „Produktsumme“ ist die Vorstufe zur Kovarianz (daher hat die „Kovarianzanalyse“ ihren Namen) 09_ancova 15
Tatsächliche Berechnung der Kovarianzanalyse Es gilt wie für die Quadratsummen: 09_ancova 16
Tatsächliche Berechnung der Kovarianzanalyse 09_ancova 17
Tatsächliche Berechnung der Kovarianzanalyse 3. ModifizierteQuadratsummen(adjusted Sums of Squares) • Die Varianz der Kovariate wird aus den Quadratsummen der AV eliminiert. 09_ancova 18
Tatsächliche Berechnung der Kovarianzanalyse 3. ModifizierteQuadratsummen(adjusted Sums of Squares) 09_ancova 19
Tatsächliche Berechnung der Kovarianzanalyse 4. F-Test und Freiheitsgrade Fkrit = 3.11 • signifikanter Effekt der Lernmethode auf den Lernerfolg • wenn gleichzeitig die mathematisch-logische Vorkenntnisse kontrolliert werden. 09_ancova 20
Reduktion der Fehlervarianz Hat die Kovarianzanalyse die Fehlervarianz reduziert? • Eine Reduktion der Fehlervarianz erfolgt nur, wenn Kovariate und AV korrelieren. • Es muss die Korrelation zwischen der Kovariate und der AV berechnet werden, die nicht auf die UV zurückgeführt werden kann.“ Reduktion der Fehlervarianz um nur 0.1%! 09_ancova 21
Voraussetzung der Kovarianzanalyse Voraussetzung der Kovarianzanalyse • Es gelten die normalen Voraussetzungen der ANOVA (Varianz-homogenität, Intervallskalenniveau, …) • Zusätzlich die Bedingung der homogenen Regressions-koeffizientenerfüllt sein: • Innerhalb jeder Gruppe wird eine Regressionsgerade bestimmt. • Der Regressionskoeffizient (b) darf sich nicht zwischen den Gruppen unterscheiden, d.h. die Koeffizienten in der Population (β) müssen gleich sein. • Statistische Überprüfung: siehe Bortz 09_ancova 22
Voraussetzung der Kovarianzanalyse Voraussetzung der Kovarianzanalyse • Es gelten die normalen Voraussetzungen der ANOVA (Varianz-homogenität, Intervallskalenniveau, …) • Zusätzlich die Bedingung der homogenen Regressions-koeffizientenerfüllt sein: • Innerhalb jeder Gruppe wird eine Regressionsgerade bestimmt. • Der Regressionskoeffizient (b) darf sich nicht zwischen den Gruppen unterscheiden, d.h. die Koeffizienten in der Population (β) müssen gleich sein. • Statistische Überprüfung: siehe Bortz 09_ancova 23
SPSS 09_ancova 24
SPSS Syntax: glmavby gruppe withkov. 09_ancova 25
SPSS F-Test für den Einfluss der UV auf die AV, bei Kontrolle der Kovariate Adjustierte Quadratsummen! 09_ancova 26
SPSS Vergleich: Ergebnis ohne Kovariate 09_ancova 27
Kovarianzanalyse Zusammenfassung • Die Kovarianzanalyse ist eine Varianzanalyse der Regressionsresiduen • Ziel: Statistische Kontrolle einer potentiellen Störvariablen. • Berechnung: • Zerlegung der Quadratsummen von Kovariate und AV • Zerlegung der Produktsummen • Berechnung der modifizierten Quadratsummen • F-Test • Ggf.: Kontrolle der Fehlervarianzreduktion 09_ancova 28