1 / 22

Multivariate Analysemethoden und Multivariates Testen

Multivariate Analysemethoden und Multivariates Testen. Vorlesung. 19.04.2010. Günter Meinhardt Johannes Gutenberg Universität Mainz. Multivariate Analysemethoden & Multivariates Testen. Vorlesung. Verfahrensdarstellung in Überblick Grundprinzip

Download Presentation

Multivariate Analysemethoden und Multivariates Testen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Multivariate Analysemethoden und Multivariates Testen Vorlesung 19.04.2010 Günter Meinhardt Johannes Gutenberg Universität Mainz

  2. Multivariate Analysemethoden & Multivariates Testen Vorlesung • Verfahrensdarstellung in • Überblick • Grundprinzip • wichtigsten mathematischen Beziehungen • Anwendungsbeispielen in Excel & Statistica • Vertiefung mit Anwendungsbeispielen • Aufgabenbearbeitung mit Excel & Statistica • Kurs Statistica (3 Gruppen) Übung/Seminar Prüfung • Kenntnisse aus WS2009/10 & SS2010 • Freischussklausur: vor 22.07.2010 (Raumfrage) • Abschlussklausur: 2.- 3. Oktoberwoche 2010

  3. Multivariate Analysemethoden & Multivariates Testen Einführung • Prinzipien des inferenzstatistischen Schliessens • Konfidenzintervalle • multivariate Mittelwertsvergleiche • multivariate Varianzanalyse (MANOVA) Verfahren • Diskriminanzanalyse • MANOVA, Hotelling‘s T2 • ANOVA - Messwiederholungsdesigns Versuchspläne • Typische Designs aus • Allgemeine Experimentelle Psy. • Klinische Psy. • AOW Ziele • Wissen über statistische Verfahren • Wissen über Untersuchungsstrategien • Umsetzung mit Software

  4. Multivariate Analysemethoden & Multivariates Testen Johnson/Wichern b) Backhaus a) Literatur c) Bortz d) Winer

  5. Multivariate Analysemethoden & Multivariates Testen Hair f) Anderson e) Literatur

  6. Univariate Mittelwertevergleiche - Problemstellung Problem Gruppierungsvariable Messgröße (metrisch) Beispiel x Geschlecht Anzahl der gefundenen Zielelemente in einem Konzentrationsleistungstest J M Frage Unterscheidet sich die Leistung von Mädchen und Jungen im statistischen Mittelwert ?

  7. Univariate Mittelwertevergleiche - Problemstellung Stichprobe Wir untersuchen 40 Mädchen und 45 Jungen Beispieldaten Geschlecht M J 23.7 – 17.2 = 6.5 Frage Gibt es wirkliche Leistungsunterschiede zwischen Jungen und Mädchen, oder ist der gefundene Unterschied „rein zufällig“ ?

  8. Univariate Mittelwertevergleiche - Prüfstrategie Strategie Ermittle die Wahrscheinlichkeit für den beobachteten Mittelwertsunterschied unter der Annahme, dass beide Gruppen in der Population denselben Mittelwert besitzen Annahme Die Populationsmittelwerte von Jungen und Mädchen sind gleich Null-Hypothese Alternativ-Hypothese Urteil Ist der beobachtete Mittelwertsunterschied unter der H0sehr unwahrscheinlich (höchstens 5%), so lehnen wir die H0 ab, und sehen die H1 als die bessere Alternative an.

  9. Population der Jungen Stichprobe des Umfangs NJ Mittelwertsdifferenz Tue dies k - mal: Population der Mädchen Stichprobe des Umfangs NM Verteilung der Differenzen von Mittelwerten Theoretische Verteilung – Sampling Distribution Sampling

  10. Theoretische Verteilung – Sampling Distribution Central Limit Theorem Die Verteilung von Differenzen von Mittelwerten nähert sich mit wachsendem Umfang der Sample-Stichproben einer Normalverteilung. Für N > 30 ist die Approximation gut. Es gilt: 0.10 (wird geschätzt) Wahrscheinlichkeitsdichte 0.05 0.00 0 -s s 2s -2s In der theoretischen Verteilung der Differenzen von Mittel-werten wird die Wahrscheinlichkeitsbestimmung vorge-nommen. Sie liegt dem inferenzstatistischen Schluss zugrunde. Inferenzstat. Schluss

  11. Ist die Messvariable eine in beiden Populationen unabhängige ZV: Unabhängigkeit Gleichheit der Populations-varianz Jungen und Mädchen kommen aus derselben Population Standardfehler Sampling Distribution – Bestimmung des Standardfehlers

  12. Sampling Distribution – Schätzung des Standardfehlers Schätzung aus Stichproben Für die Populationsvarianz verwendet man eine Schätzung aus den Daten beider Stichproben: “Pooling” wobei und die Stichprobenvarianzen sind Dann gilt Schätzformel (Beste Schätzung des Standardfehlers aus Stichprobendaten)

  13. _ _ z x Die z- Transformation übersetzt die Rohdatenskala in die Standardskala ( z = 0, sz = 1) _ Normalverteilung – z –Standardnormalverteilung f (z) f (x) 0.10 0.10 Wahrscheinlichkeitsdichte Wahrscheinlichkeitsdichte 0.05 0.05 z x 0.00 0.00 20 30 40 50 60 70 80 -3 -2 -1 0 1 2 3 Standard-Normalverteilung Normalverteilung

  14. z- Skala der Differenzen von Mittelwerten Unter der H0 gilt Prüfgrösse ist standardnormalverteilt Dann gilt: Transformation [ ] [ ] Sampling Distribution – Prüfgrösse

  15. Prüfgrösse Annahmebereich Ablehnungsbereich Ablehnungsbereich Entscheidung über Prüfgrösse mit Standardnormalverteilung Signifikanzniveau 0.2 0.1 t -4 -2 2 4 0 Testen zum Signifikanzniveau :Ist |z| > z1-a/2?

  16. Ermittle kritischen z - Wert z1-a/2für ein a- Fehlerniveau 2. Kritischer z - Wert A. Gilt|z| > z1-a/2 Ablehnung von H0 _ B. Gilt|z| < z1-a/2 Beibehalten von H0 Entscheidung über Signifikanz des Mittelwerteunterschieds 1. Prüfgrösse Berechne 3. Entscheide (die Mittelwerte der J. und M. sind signifikant verschieden) (die Mittelwerte der J. und M. unterscheiden sich zufällig)

  17. Standardfehler Prüfgrösse und Kritischer Wert z1-a/2 = z0.975 = 1.96 d.h.|z| > z1-a/2 Entscheidung 2.52 > 1.96 H0 ablehnen Numerisches Beispiel Differenz der Mittelwerte 23.7 – 17.2 = 6.5 Die Mittelwerte entstammen nicht derselben Population (unterscheiden sich signifikant)

  18. Voraussetzungen der Prüfung Varianz-homogenität • Die Populationsvarianzen die beiden Stichproben zu • Grunde liegen, müssen gleich (homogen) sein. (Prüfung mit geignetem Verfahren) Unabhängigkeit b. Die Messeinheiten innerhalb jeder Stichprobe müssen unabhängig sein. c. Die Messeinheiten beider Stichproben dürfen nicht teilweise paarweise zuzuordnen sein. Verletzungen Der Test ist relativ robust gegen Verletzungen der Varianzhomogenität. Verletzungen der Unabhängigkeit (b.) führen zur Ungültigkeit der Prüfgrösse, der Unab- hängigkeit (c.) je nach Höhe der Korrelationen zu progressiven (kleine Korr.) oder zu konservativen Entscheidungen (hohe Korr.).

  19. Mittelwertsprüfung bei mehreren Variablen Beispiel Lebenszufriedenheit Arbeit Privatsphäre X1: Gehalt X4: Ehe X2: Entscheidungsfreiheit X5: Freunde/Beziehungen X3: Qualität der Kommunikation X6: Sexualität 10 Variablen Person Aktivität X7: Lebensansprüche X9: Hobbies X8: Sinnhaftigkeit X10: Sport/Fitness 2 Gruppen Herzinfarktpatienten Gesunde

  20. Multivariate Mittelwertsvergleiche - Einzeltestungen Frage Unterscheiden sich Gesunde und Patienten im Variablen-komplex Lebenszufriedenheit? Teststrategie Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t- Test. Wenn irgend einer der Tests signifikantwird, sehen wir die Gruppen als verschieden an. Probleme • Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft. • Unterstellte Unabhängigkeit: Man behandelt die einzelnen Skalen als unabhängig voneinander. • Fehlendes Konstrukt: Lebenszufriendenheit wird nicht alsVariablenkomplex mit Binnenstruktur behandelt. • Mangelnde Teststärke: Man nutzt nicht die Korrelations-struktur der Variablen für einen leistungsfähigen Test. Ausweg Verwendung eines multivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in eine statistische Prüfgrösse einfliessen lässt.

  21. Setzt man das overall -Niveau fest und löst nach auf, folgt Einzeltestungen - Bonferronikorrektur a - FehlerKumulierung Bei simultanen Einzeltestungen „kumuliert“ sich das a – Risiko: Overall a Bonferroni Approximation Um alle m Tests auf einem konventionellen Alpha Niveau abzusichern, muss dieses durch die Anzahl der Tests geteilt werden. Bei 10 Tests muss man für ein overall Alpha= 5% ein Test-Alpha von 0.5% verwenden.

  22. Multivariate Mittelwertsvergleiche - Verfahren Variablen-komplex Multivariates Testkonstrukt Multivariate Distanz (Mahalanobisdistanz) Optimale Linearkombination (Linear Discriminant Function) Multivariate Quadratsummen (SSCP-Matrizen-Zerlegung) Verfahren MANOVA Diskriminanz- Analyse Hotelling‘s T2 Alle Verfahren entscheiden über den Gruppenunterschied im gesamten Variablenkomplex mit einem statistischen Test

More Related