300 likes | 488 Views
Multivariate Analysemethoden und Multivariates Testen. Vorlesung. Mai 2010. Günter Meinhardt Johannes Gutenberg Universität Mainz. Multivariates Testen MANOVA. Multivariate Varianzanalyse (MANOVA). Ziele.
E N D
Multivariate Analysemethoden und Multivariates Testen Vorlesung Mai 2010 Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariates Testen MANOVA Multivariate Varianzanalyse (MANOVA) Ziele • Mehrgruppen / Mehrfaktorenvergleiche von Messungen auf mehreren abhängigen Variablen. • Vermeidung von Entscheidungsfehlern durch fälschliche implizite Unabhängigkeitsannahme bei univariater Abtestung der einzelnen abhängigen Variablen. • Vermeidung der Probleme durch multiples Testen durch Verwendung eines einzigen Tests für das gesamte Design. • Verbesserte Teststärke und Validität bei Verwendung von Testbatterien und (mäßig) korrelierten Profilskalen. Voraussetzung • Gleiche (homogene) Varianz-Kovarianz Matrizen (Sj) in allen Gruppen. • Testungen der Gruppenunterschiede (Centroide), sowie der Homogenität der Sj- Matrizen erfordern die Gültigkeit der multivariaten Normalverteilung.
Multivariates Testen MANOVA Ansatz • Vergleich der Quadratsummen für „between“ und „within“ Group Varianz, erzeugt aus allen Variablenkomponenten. • Statistik erhält man ebenso über über Eigenwertzerlegung einer ausB und W Komponenten zusammengesetzten Matrix. Anwendung • Allgemein: Experimentelle Analyse im Rahmen von multidimen- sionalen Evaluationsstudien. • Multiple Effektivitätsstudien. Nachweise der Veränderung von Profilen durch experimentelle oder therapeutische Intervention in repeated measurement Designs. • Untersuchung differentieller Effekte auf mehren Ebenen (Mehrebeneanalyse). (Z.B. Arbeitszufriedenheit auf 3 Hierachieebenen untersuchen). Nachteile • Restriktion gleicher Varianz-Kovarianz Matrizen in allen Gruppen. • Auswirkung der Verletzung der Annahme der multivariaten Normalverteilung schwer abzuschätzen.
3.5 3.0 2.5 2.0 Fahrleistung: X2 1.5 1.0 0.5 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 Koordination: X1 0.5 Promill 1 Promill 2D Beispiel MANOVA 2D-Beispiel Regression 0.5 Promill Regression 1 Promill PrototypischeDatensituation • Generell: g- Gruppen gemessen auf p Variablen. Hier g=2, p=2, Koordination (X1) und Fahrleistung (X2) • Gleiche Regressionssteigungen und gleiche Varianzen in den Gruppen auf beiden Variablen (Homogenität der Varianzen und Covarianzen) • Stichprobendaten entstammen multivariat normalverteilten Populationen.
0.5 Promill 1 Promill 2D Beispiel MANOVA Fahrleistung: X2 2D-Beispiel Regression 0.5 Promill Regression 1 Promill Koordination: X1 1D - Testen unzulänglich • Univariat sind die Rohwertverteilungen nicht gut getrennt, und daher ebenfalls nicht die Mittelwerteverteilungen (hohes N nötig für signi- fikante Gruppenunterschiede in den Kennwerteverteilungen) • Signifikanzurteile sind unabhängig und führen zu p Signifikanzaus- sagen, obwohl nur eine erwünscht ist • Information der gleichen Beziehung zwischen den abhängigen Variablen (gleiche Korrelation) wird nicht genutzt .
0.5 Promill 1 Promill 2D Beispiel MANOVA Fahrleistung: X2 2D-Beispiel Regression 0.5 Promill Regression 1 Promill Koordination: X1 2D - Testen Ausgangslage • 2D 95% Quantile zeigen an, daß die Mittelwerte der jeweils anderen Gruppe nicht mehr im Konfidenzbereich der Rohwerte liegen (bei den univariaten Verteilungen liegen sie darin) • Orthogonal zur Hauptvarianzrichtung der Ellipsen bestehen optimale Trennbedingungen für die Mittelwerte • Ein Test, in den die Korrelation der beiden Variablen eingeht, hat daher optimale Chancen, Unterschiede der Centroide aufzudecken. MANOVA
Konstanten g = Anzahl Gruppen n = Snl = n1+ n2+…ng p = Anzahl Variablen Population 1: Population 2: Indices i : Fälle (Personen) l : Gruppen Population g: 1. One-Way MANOVA MANOVA Problem Unterscheiden sich g unabhängige Populationen in ihren auf p Variablen gemessenen Centroiden ? Annahmen • Die Samples X1l, X2l,…, Xnll sind Zufallsstichproben der Größe nl mit einem Populationszentroiden ml. Die Zufallsstichproben sind unabhängig. • Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. • Jede Population ist p- variat normalverteilt.
Parameter- schätzer … xilj Case Group Zu prüfende Annahmen Var Homogenität der Varianz-Covarianz-Matrizen und p-variate Normalverteilung der Stichprobenwerte 1. One-Way MANOVA MANOVA Datenschema Population 1: Population 2: Population g:
Additives Modell zum Vergleich von Centroiden aus g Populationen mit eilunabhängigenund N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Beobachtung Grand Mean Treatmenteffekt Fehlerkomponente Grand Mean abziehen, Kreuzprodukt bilden , und summieren über Fälle ergibt: p x p Matrizen Totale QS und Kreuzprodukte Treatment QS und Kreuzprodukte Fehler QS und Kreuzprodukte 1D Analog 1. One-Way MANOVA MANOVA MANOVA Modell
1. One-Way MANOVA MANOVA p x p Matrizen Hierin sind die x Vektoren mit p Komponenten (Variablen): Regel Die Matrizen B und W werden als inneres Produkt (Zeilen- mal Spalten) der Variablen-Vektoren aufgebaut und dann über Fälle und Gruppen summiert. Sie sind stets p x p Matrizen. Matrix-Notation Additivität der Variation Within Group QS und Kreuzprodukte Es gilt: Totale QS und Kreuzprodukte Between Group QS und Kreuzprodukte
1. One-Way MANOVA MANOVA W-Matrix aus gepoolten S- Matrizen mit Sl der Varianz-Covarianz Matrix in Gruppe l. B-Matrix (p=2 Vars Beispiel) Treatment (Group) Quadratsummen & Kreuzprodukte x1 x2 x1 x2 Komponenten Var Var Group
1. One-Way MANOVA MANOVA MANOVA Table Source of Variation Matrix of SS & Cross- Products (SSP) Degrees of Freedom g - 1 B Treatment W Error n- 1 M = B + W Total Test-Statistik Die H0: t1 = t2 = … = tg = 0 wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. mit s der Rang der Matrix W-1B und li ihr i-ter Eigenwert Alternative Berechnung
1. One-Way MANOVA MANOVA Lehne H0 ab, wenn c2 - Test der Wilks Statistik (c2 Verteilung mit p(g-1) Freiheitsgraden, Bartlett) Für p < 3 und g < 3 sind F-Tests üblich. Bartletts Test ist für größere Stichproben und eine größere Anzahl Variablen exakt. Simultane Kontraste Als Kontraste sind Wilks-Tests oder Hotellings T2 gebräuchlich: ist verteilt wie mit Vorteil der MANOVA (Höhere Freiheitsgrade)
1. One-Way MANOVA MANOVA Voraussetzung Homogene S – Matrizen Prüfgröße Box-M Test ist c2 verteilt mit p(p+1)(g-1)/2 Freiheitsgraden Voraussetzungund Probleme der Prüfung Der Test setzt multivariat normalverteilte Populationen voraus. Ebenso sollte die Anzahl der Messungen in den Gruppen >20 und die Anzahl der Variablen < 5 sein. Testung über die Homogenität der Korrelationsmatrizen (Residualanalyse) prüft nur die Homogenität der Covarianzen, nicht der Varianzen. Diese können aber mit einem Bartlett Test Gesondert auf Homogenität geprüft werden.
Pop 1: Pop 1: Pop 2: Pop 2: Pop g: Pop k: 2. Two-Way MANOVA MANOVA Problem Gibt es Effekte in auf p Variablen gemessenen Centroiden hinsichtlich Der Stufen von Faktor A, Faktor B und ihrer Kombinationen A x B ? Faktor B Faktor A Annahmen • Alle Samples sind Zufallsstichproben mit einem Populations-zentroiden ml. Die Zufallsstichproben sind unabhängig. • Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. • Jede Population ist p- variat normalverteilt. (gleiche Annahmen wie in der Oneway-MANOVA, aber bezogen auf alle g x k Samples)
x1. x2. x3. x.1 x.2 x11 x12 x22 x21 x31 x23 Exkurs: Two-Way ANOVA MANOVA Datenschema Jede Messung wird nach Fall/StufeA/StufeB indiziert A Case A1 A2 A3 x111 x121 x131 1 x211 x221 x231 2 x311 x321 x331 3 B1 x411 x421 x431 A: g Stufen, Index l B: k Stufen, Index r VP: n Cases,Index i 4 x511 x521 x531 5 B x112 x122 x132 1 x212 x222 x232 2 x312 x322 x332 B2 3 x412 x422 x432 4 x512 x522 x532 5 Mittelwerte Zellmittel und Faktorstufenmittel (über .-Stelle gemittelt)
Exkurs: Two-Way ANOVA MANOVA Komponenten Modell Additives Modell zur Erklärung einer individuellen Messung mit eilr ein unabhängigerund N(0,s) verteilter Meßfehler. Quadratsummen Zerlegung Varianzanteile Faktor A Faktor B Fehler A x B Gesamt
Beispiel: QSAxB Erwartung: Beobachtung: Exkurs: Two-Way ANOVA MANOVA Allgemeine Form der Quadratsumme Erwartungswert der Bedingung Bedingung Beobachtung unter Bedingung Summe über alle Fälle der Bedingung
Exkurs: Two-Way ANOVA MANOVA ANOVA QS Table SoV QS df g- 1 A k- 1 B (g-1) (k-1) A x B Error Total
Exkurs: Two-Way ANOVA MANOVA Fehlervarianz Schätzungen 1. Schätzung aus der Variation innerhalb Zellen: 2. Schätzung aus der Variation zwischen Zellen (Beispiel A) F-Bruch Nullhypothese & erwarteter F-Bruch Quotienten von Varianzen sind F- verteilt. Der Erwartungswert unter der Nullhypothese für den F- Quotienten ist 1.
Exkurs: Two-Way ANOVA MANOVA Ergebnistabelle F - Tests DieF- Tabelle gibt einen Überblick über die Signifikanztestung. Ergebnistabelle Varianzanteile Dieh2- Tabelle gibt einen Überblick über die Varianzaufklärung und die anteilige Verteilung auf die Quellen
2. Two-Way MANOVA MANOVA MANOVA Modell Additives Modell einer individuellen Messung auf p- Variablen mit eilrunabhängigenund N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Dem Komponentenmodell entspricht eine additive Zerlegung auf den p- stelligen Variablenvektoren p x p Matrizen (QS-Zerlegung) M = BA + BB + BAB + W Die Matrizen enthalten entsprechende Sums of Squares and Cross Products (SSP), daher wird oft diese Bezeichnung verwendet: SSPTotal = SSPA + SSPB + SSPAB + SSPError
2. Two-Way MANOVA MANOVA MANOVA SSP Table SoV SSP df g- 1 A k- 1 B A x B (g-1) (k-1) Error Total
2. Two-Way MANOVA MANOVA Test-Statistik Die H0 für jede Varianzquelle wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. c2 - Tests Lehne H0 ab, wenn Faktor A Faktor B A x B
M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) auf beiden Variablen, keine Haupteffekte Alkohol (A) Faktor - Plots
M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) nur auf X, keine Haupteffekte Alkohol (A) Faktor - Plots
M W A 3 X-Y - Plot 2 1 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Kein Effekt (B) zwei gegenläufige Haupteffekte (A), keine Interaktionen Faktor - Plots
M W A 3 2 1 1 X-Y - Plot 2 3 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gleichgerichtete Interaktionen Faktor - Plots
M W A 1 2 3 3 X-Y - Plot 2 1 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gegengerichtete Interaktionen Faktor - Plots
M W A 3 2 1 X-Y - Plot 1 3 2 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, eine Interaktion (X) Faktor - Plots