1 / 30

Multivariate Analysemethoden und Multivariates Testen

Multivariate Analysemethoden und Multivariates Testen. Vorlesung. 21.05.2007 & 04.06.2007. Günter Meinhardt Johannes Gutenberg Universität Mainz. Multivariates Testen MANOVA. Multivariate Varianzanalyse (MANOVA). Ziele.

hawa
Download Presentation

Multivariate Analysemethoden und Multivariates Testen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Multivariate Analysemethoden und Multivariates Testen Vorlesung 21.05.2007 & 04.06.2007 Günter Meinhardt Johannes Gutenberg Universität Mainz

  2. Multivariates Testen MANOVA Multivariate Varianzanalyse (MANOVA) Ziele • Mehrgruppen / Mehrfaktorenvergleiche von Messungen auf mehreren abhängigen Variablen. • Vermeidung von Entscheidungsfehlern durch fälschliche implizite Unabhängigkeitsannahme bei univariater Abtestung der einzelnen abhängigen Variablen. • Vermeidung der Probleme durch multiples Testen durch Verwendung eines einzigen Tests für das gesamte Design. • Verbesserte Teststärke und Validität bei Verwendung von Testbatterien und (mäßig) korrelierten Profilskalen. Voraussetzung • Gleiche (homogene) Varianz-Kovarianz Matrizen (Sj) in allen Gruppen. • Testungen der Gruppenunterschiede (Centroide), sowie der Homogenität der Sj- Matrizen erfordern die Gültigkeit der multivariaten Normalverteilung.

  3. Multivariates Testen MANOVA Ansatz • Vergleich der Quadratsummen für „between“ und „within“ Group Varianz, erzeugt aus allen Variablenkomponenten. • Statistik erhält man ebenso über über Eigenwertzerlegung einer ausB und W Komponenten zusammengesetzten Matrix. Anwendung • Allgemein: Experimentelle Analyse im Rahmen von multidimen- sionalen Evaluationsstudien. • Multiple Effektivitätsstudien. Nachweise der Veränderung von Profilen durch experimentelle oder therapeutische Intervention in repeated measurement Designs. • Untersuchung differentieller Effekte auf mehren Ebenen (Mehrebeneanalyse). (Z.B. Arbeitszufriedenheit auf 3 Hierachieebenen untersuchen). Nachteile • Restriktion gleicher Varianz-Kovarianz Matrizen in allen Gruppen. • Auswirkung der Verletzung der Annahme der multivariaten Normalverteilung schwer abzuschätzen.

  4. 3.5 3.0 2.5 2.0 Fahrleistung: X2 1.5 1.0 0.5 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 Koordination: X1 0.5 Promill 1 Promill 2D Beispiel MANOVA 2D-Beispiel Regression 0.5 Promill Regression 1 Promill PrototypischeDatensituation • Generell: g- Gruppen gemessen auf p Variablen. Hier g=2, p=2, Koordination (X1) und Fahrleistung (X2) • Gleiche Regressionssteigungen und gleiche Varianzen in den Gruppen auf beiden Variablen (Homogenität der Varianzen und Covarianzen) • Stichprobendaten entstammen multivariat normalverteilten Populationen.

  5. 0.5 Promill 1 Promill 2D Beispiel MANOVA Fahrleistung: X2 2D-Beispiel Regression 0.5 Promill Regression 1 Promill Koordination: X1 1D - Testen unzulänglich • Univariat sind die Rohwertverteilungen nicht gut getrennt, und daher ebenfalls nicht die Mittelwerteverteilungen (hohes N nötig für signi- fikante Gruppenunterschiede in den Kennwerteverteilungen) • Signifikanzurteile sind unabhängig und führen zu p Signifikanzaus- sagen, obwohl nur eine erwünscht ist • Information der gleichen Beziehung zwischen den abhängigen Variablen (gleiche Korrelation) wird nicht genutzt .

  6. 0.5 Promill 1 Promill 2D Beispiel MANOVA Fahrleistung: X2 2D-Beispiel Regression 0.5 Promill Regression 1 Promill Koordination: X1 2D - Testen Ausgangslage • 2D 95% Quantile zeigen an, daß die Mittelwerte der jeweils anderen Gruppe nicht mehr im Konfidenzbereich der Rohwerte liegen (bei den univariaten Verteilungen liegen sie darin) • Orthogonal zur Hauptvarianzrichtung der Ellipsen bestehen optimale Trennbedingungen für die Mittelwerte • Ein Test, in den die Korrelation der beiden Variablen eingeht, hat daher optimale Chancen, Unterschiede der Centroide aufzudecken. MANOVA

  7. Konstanten g = Anzahl Gruppen n = Snl = n1+ n2+…ng p = Anzahl Variablen Population 1: Population 2: Indices i : Fälle (Personen) l : Gruppen Population g: 1. One-Way MANOVA MANOVA Problem Unterscheiden sich g unabhängige Populationen in ihren auf p Variablen gemessenen Centroiden ? Annahmen • Die Samples X1l, X2l,…, Xnll sind Zufallsstichproben der Größe nl mit einem Populationszentroiden ml. Die Zufallsstichproben sind unabhängig. • Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. • Jede Population ist p- variat normalverteilt.

  8. Parameter- schätzer … xilj Case Group Zu prüfende Annahmen Var Homogenität der Varianz-Covarianz-Matrizen und p-variate Normalverteilung der Stichprobenwerte 1. One-Way MANOVA MANOVA Datenschema Population 1: Population 2: Population g:

  9. Additives Modell zum Vergleich von Centroiden aus g Populationen mit eilunabhängigenund N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Beobachtung Grand Mean Treatmenteffekt Fehlerkomponente Grand Mean abziehen, Kreuzprodukt bilden , und summieren über Fälle ergibt: p x p Matrizen Totale QS und Kreuzprodukte Treatment QS und Kreuzprodukte Fehler QS und Kreuzprodukte 1D Analog 1. One-Way MANOVA MANOVA MANOVA Modell

  10. 1. One-Way MANOVA MANOVA p x p Matrizen Hierin sind die x Vektoren mit p Komponenten (Variablen): Regel Die Matrizen B und W werden als inneres Produkt (Zeilen- mal Spalten) der Variablen-Vektoren aufgebaut und dann über Fälle und Gruppen summiert. Sie sind stets p x p Matrizen. Matrix-Notation Additivität der Variation Within Group QS und Kreuzprodukte Es gilt: Totale QS und Kreuzprodukte Between Group QS und Kreuzprodukte

  11. 1. One-Way MANOVA MANOVA W-Matrix aus gepoolten S- Matrizen mit Sl der Varianz-Covarianz Matrix in Gruppe l. B-Matrix (p=2 Vars Beispiel) Treatment (Group) Quadratsummen & Kreuzprodukte x1 x2 x1 x2 Komponenten Var Var Group

  12. 1. One-Way MANOVA MANOVA MANOVA Table Source of Variation Matrix of SS & Cross- Products (SSP) Degrees of Freedom g - 1 B Treatment W Error n- 1 M = B + W Total Test-Statistik Die H0: t1 = t2 = … = tg = 0 wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. mit s der Rang der Matrix W-1B und li ihr i-ter Eigenwert Alternative Berechnung

  13. 1. One-Way MANOVA MANOVA Lehne H0 ab, wenn c2 - Test der Wilks Statistik (c2 Verteilung mit p(g-1) Freiheitsgraden, Bartlett) Für p < 3 und g < 3 sind F-Tests üblich. Bartletts Test ist für größere Stichproben und eine größere Anzahl Variablen exakt. Simultane Kontraste Als Kontraste sind Wilks-Tests oder Hotellings T2 gebräuchlich: ist verteilt wie mit Vorteil der MANOVA (Höhere Freiheitsgrade)

  14. 1. One-Way MANOVA MANOVA Voraussetzung Homogene S – Matrizen Prüfgröße Box-M Test ist c2 verteilt mit p(p+1)(g-1)/2 Freiheitsgraden Voraussetzungund Probleme der Prüfung Der Test setzt multivariat normalverteilte Populationen voraus. Ebenso sollte die Anzahl der Messungen in den Gruppen >20 und die Anzahl der Variablen < 5 sein. Testung über die Homogenität der Korrelationsmatrizen (Residualanalyse) prüft nur die Homogenität der Covarianzen, nicht der Varianzen. Diese können aber mit einem Bartlett Test Gesondert auf Homogenität geprüft werden.

  15. Pop 1: Pop 1: Pop 2: Pop 2: Pop g: Pop k: 2. Two-Way MANOVA MANOVA Problem Gibt es Effekte in auf p Variablen gemessenen Centroiden hinsichtlich Der Stufen von Faktor A, Faktor B und ihrer Kombinationen A x B ? Faktor B Faktor A Annahmen • Alle Samples sind Zufallsstichproben mit einem Populations-zentroiden ml. Die Zufallsstichproben sind unabhängig. • Alle Populationen haben dieselbe wahre Varianz-Covarianzmatrix S. • Jede Population ist p- variat normalverteilt. (gleiche Annahmen wie in der Oneway-MANOVA, aber bezogen auf alle g x k Samples)

  16. x1. x2. x3. x.1 x.2 x11 x12 x22 x21 x31 x23 Exkurs: Two-Way ANOVA MANOVA Datenschema Jede Messung wird nach Fall/StufeA/StufeB indiziert A Case A1 A2 A3 x111 x121 x131 1 x211 x221 x231 2 x311 x321 x331 3 B1 x411 x421 x431 A: g Stufen, Index l B: k Stufen, Index r VP: n Cases,Index i 4 x511 x521 x531 5 B x112 x122 x132 1 x212 x222 x232 2 x312 x322 x332 B2 3 x412 x422 x432 4 x512 x522 x532 5 Mittelwerte Zellmittel und Faktorstufenmittel (über .-Stelle gemittelt)

  17. Exkurs: Two-Way ANOVA MANOVA Komponenten Modell Additives Modell zur Erklärung einer individuellen Messung mit eilr ein unabhängigerund N(0,s) verteilter Meßfehler. Quadratsummen Zerlegung Varianzanteile Faktor A Faktor B Fehler A x B Gesamt

  18. Beispiel: QSAxB Erwartung: Beobachtung: Exkurs: Two-Way ANOVA MANOVA Allgemeine Form der Quadratsumme Erwartungswert der Bedingung Bedingung Beobachtung unter Bedingung Summe über alle Fälle der Bedingung

  19. Exkurs: Two-Way ANOVA MANOVA ANOVA QS Table SoV QS df g- 1 A k- 1 B (g-1) (k-1) A x B Error Total

  20. Exkurs: Two-Way ANOVA MANOVA Fehlervarianz Schätzungen 1. Schätzung aus der Variation innerhalb Zellen: 2. Schätzung aus der Variation zwischen Zellen (Beispiel A) F-Bruch Nullhypothese & erwarteter F-Bruch Quotienten von Varianzen sind F- verteilt. Der Erwartungswert unter der Nullhypothese für den F- Quotienten ist 1.

  21. Exkurs: Two-Way ANOVA MANOVA Ergebnistabelle F - Tests DieF- Tabelle gibt einen Überblick über die Signifikanztestung. Ergebnistabelle Varianzanteile Dieh2- Tabelle gibt einen Überblick über die Varianzaufklärung und die anteilige Verteilung auf die Quellen

  22. 2. Two-Way MANOVA MANOVA MANOVA Modell Additives Modell einer individuellen Messung auf p- Variablen mit eilrunabhängigenund N(0,S) verteilten Fehlerkomponenten. Additive Zerlegung Dem Komponentenmodell entspricht eine additive Zerlegung auf den p- stelligen Variablenvektoren p x p Matrizen (QS-Zerlegung) M = BA + BB + BAB + W Die Matrizen enthalten entsprechende Sums of Squares and Cross Products (SSP), daher wird oft diese Bezeichnung verwendet: SSPTotal = SSPA + SSPB + SSPAB + SSPError

  23. 2. Two-Way MANOVA MANOVA MANOVA SSP Table SoV SSP df g- 1 A k- 1 B A x B (g-1) (k-1) Error Total

  24. 2. Two-Way MANOVA MANOVA Test-Statistik Die H0 für jede Varianzquelle wird abgelehnt, wenn (Quotient der generalisierten Varianzen, „Wilk‘s Lambda“) zu klein wird. c2 - Tests Lehne H0 ab, wenn Faktor A Faktor B A x B

  25. M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) auf beiden Variablen, keine Haupteffekte Alkohol (A) Faktor - Plots

  26. M W A X-Y - Plot (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Geschlechtseffekt (B) nur auf X, keine Haupteffekte Alkohol (A) Faktor - Plots

  27. M W A 3 X-Y - Plot 2 1 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Kein Effekt (B) zwei gegenläufige Haupteffekte (A), keine Interaktionen Faktor - Plots

  28. M W A 3 2 1 1 X-Y - Plot 2 3 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gleichgerichtete Interaktionen Faktor - Plots

  29. M W A 1 2 3 3 X-Y - Plot 2 1 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, 2 gegengerichtete Interaktionen Faktor - Plots

  30. M W A 3 2 1 X-Y - Plot 1 3 2 (Standardisiert an Fehlervarianz jeder Variable) 2. Two-Way MANOVA - Plots MANOVA A: Alkohol (3 Stufen) B: Geschlecht (M/W) x: Fahrleistung y: Koordination Beispiel Keine Haupteffekte, eine Interaktion (X) Faktor - Plots

More Related