350 likes | 719 Views
Non-parametrische Testverfahren. Gliederung Definition Der χ ² Test Kolmogorov-Smirnov-Test Überblick weitere Verfahren: Der Fisher-Yates-Test Der McNemar -Test Cochran-Test (Q-Test) Der Mediantest Der U-Test (Mann-Whitney Test) Vorzeichentest und Vorzeichenrangtest
E N D
Non-parametrische Testverfahren 11_nonpara1 Gliederung • Definition • Der χ² Test • Kolmogorov-Smirnov-Test • Überblick weitere Verfahren: • Der Fisher-Yates-Test • Der McNemar-Test • Cochran-Test (Q-Test) • Der Mediantest • Der U-Test (Mann-Whitney Test) • Vorzeichentest und Vorzeichenrangtest • Der Friedman-Test • Binominal-Test
Non-parametrische Testverfahren 11_nonpara2 Definition: • Nonparametrische(verteilungsfreie) Testverfahren setzen nicht eine bestimmte Verteilungsformen des erfassten Merkmals (z.B. Normalverteilung) voraus. • NonparametrischeVerfahren werden eingesetzt… • für die Analyse von Ordinal- oder Nominalskalierten Variablen • Wenn die Normalverteilungsannahme verletzt ist. • Parametrische Verfahren dürfen nur verwendet werden, wenn die beteiligten Variablen die gefordert Verteilungsform ausweisen (z.B. Normalverteilung für den t-Test). Sie haben in der Regel eine höher statistische Power.
Der χ² -Test 11_nonpara3 • Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen vorliegen. Beispiele: • Leiden Männer und Frauen gleich häufig an einer bestimmten Erkrankung? • Leisten hoch-ängstlich und gering-ängstliche Personen gleich häufig Hilfe in einer Notsituation?
Der χ² -Test 11_nonpara4 Voraussetzung für den χ² -Test (Faustregeln) • Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit kleiner als 5. • Keine Zelle weist eine erwartete Häufigkeit kleiner als 1 auf. Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der Fisher-Yates-Test verwendet werden.
Der χ² -Test 11_nonpara5 χ² -Test – Beispiel 1 • Es soll geprüft werden, ob die Verteilung von Männern und Frauen in einer Gruppe signifikant von einer Gleichverteilung abweicht. • N = 76 (Frauen: 56; Männer: 20) • Statistische Hypothesen • H0: π(Frau) = π(Mann) • H1: π(Frau) ≠ π(Mann)
Der χ² -Test 11_nonpara6 Schritt 1: • Zunächst werden die nach der H0 zu erwarteten Häufigkeiten berechnet: • Beobachtet: NF = 56; NM=20 • Erwartet: ??? • Gesamtzahl: 76 • Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu erwarten.
Der χ² -Test 11_nonpara7 Schritt 2: • Nun wird der (empirische) χ²-Wert berechnet: mit: • k: Anzahl der Stufen der beiden Variablen • fb,i: Beobachtete Häufigkeit in der Zelle (i) • fe,i: Erwartete Häufigkeit in der Zelle (i)
Der χ² -Test 11_nonpara8
Der χ² -Test 11_nonpara9 Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f). Für α=.05 ergibt sich bei df=1: Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.
Der χ² -Test 11_nonpara10 χ² -Test – Beispiel 2 • Frage: Ist die (relative) Häufigkeit hoher bzw. geringer Ängstlichkeit bei Männern und Frauen gleich? • Statistische Hypothesen • H0: π(Angst | Frau) = π(Angst | Mann) • H1: π(Angst | Frau) ≠ π(Angst | Mann)
Der χ² -Test 11_nonpara11 Schritt 1: Zunächst werden aus den Randsummen die nach der H0 zu erwarteten Häufigkeiten geschätzt: Beobachtet: Erwartet:
Der χ² -Test 11_nonpara12 Schritt 2: Nun wird der (empirische) χ²-Wert berechnet: mit: • k, l: Anzahl der Stufen der beiden Variablen • fb(i,j): Beobachtete Häufigkeit in der Zelle (i,j) • fe(i,j): Erwartete Häufigkeit in der Zelle (i,j)
Der χ² -Test 11_nonpara13 Beobachtet: Erwartet:
Der χ² -Test 11_nonpara14 Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen χ²-Wert. Der kritische χ²-Wert wird in Abhängigkeit von den Freiheits-graden und dem gewählten α-Niveau aus einer Tabelle zur χ²-Verteilung abgelesen (Leonhart, S.448f). Für α=.05 ergibt sich bei df=1: Die H0 muss verworfen werden; folglich kann ein Unterschied nachgewiesen werden.
Der χ² -Test in SPSS 11_nonpara15
Der χ² -Test in SPSS NPAR TEST /CHISQUARE=sex /EXPECTED=EQUAL 11_nonpara16
Der χ² -Test in SPSS • SPSS-Ausgabe: 11_nonpara17
Der Kolmogorov-Smirnov-Test • Der Kolmogorov-Smirnov-Test • Der Kolmogorov-Smirnov-Test vergleicht eine empirische Verteilung mit einer vorgegebenen theoretischen Verteilung (z.B. Normalverteilung). • Damit ist es möglich, die Voraussetzung parametrischer Testverfahren (z.B. für den t-Test) zu überprüfen. • Statistische Hypothesen: • H0: Die Variable ist normalverteilt • H1: Die Variable ist nicht normalverteilt 11_nonpara18
Der Kolmogorov-Smirnov-Test in SPSS 11_nonpara19
Der Kolmogorov-Smirnov-Test in SPSS NPAR TESTS/K-S(NORMAL)=freiburgpsychostat. 11_nonpara20
Der Kolmogorov-Smirnov-Test in SPSS • Wenn p<.05 ist die Normalverteilungsannahme verletzt. 11_nonpara21
Überblick weitere Verfahren: 11_nonpara22
Der Fisher-Yates-Test Der Fisher-Yates-Test Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind (d.h. bei geringen erwarteten Häufigkeiten). Beispiel: Berechnung: Siehe Leonhart (2004), Seite 162f 11_nonpara 23
McNemar-Test Der McNemar-Test Der McNemar-Test wird für nominalskalierten Daten in zwei abhängigen Stichproben (z.B. Messwiederholung) verwendet . Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein. Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins Erwachsenenalter. Berechnung: Siehe Leonhart (2004), Seite 163f 11_nonpara 24
Cochran-Test (Q-Test) Der Cochran-Test (Q-Test) Der Cochran-Test dient der Auswertung von nominalskalierten Daten in mehr als zwei abhängigen Stichproben. Beispiel: (NR=Nichtraucher; R=Raucher) Berechnung: Siehe Leonhart (2004), Seite 165f 11_nonpara 25
Mediantest Der Mediantest Der Der Mediantestdient dem Vergleich der zentralen Tendenz ordinalskalierter Variablen, wenn zwei unabhängige Stichproben vorliegen. Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen Männern und Frauen verglichen werden (Da die Zeiten nicht normalverteilt sind, soll kein t-Test gerechnet werden) Berechnung: Siehe Leonhart (2004), Seite 162f 11_nonpara 26
U-Test (Mann-Whitney-Test) Der U-Test (Mann-Whitney-Test) Der U-Testvergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. Anmerkung: Der U-Test hat einer höhere Power als der Mediantest, jedoch ist er empfindlicher gegenüber Ausreißerwerten. Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischeneiner Therapiegruppe und einer „Wartekontrollgruppe“ verglichen werden. Berechnung: Siehe Leonhart (2004), Seite 169f 11_nonpara 27
U-Test (Mann-Whitney-Test) 11_nonpara 28
U-Test (Mann-Whitney-Test) NPAR TESTS/M-W= freiburg BY sex(1 2) . 11_nonpara 29
U-Test (Mann-Whitney-Test) • Weil p>.05 besteht also kein bedeutsamer Rangunterschied. 11_nonpara 30
H-Test (Kruskal & Wallis -Test) Der H-Test (Kruskal & Wallis -Test) Der U-Testvergleicht die zentrale Tendenz eines ordinalskalierten Merkmals zwischen zwei unabhängigen Zufallsstichproben. Beispiel: Der Therapieerfolg soll zwischen drei Therapie-verfahren sowie einer „Wartekontrollgruppe“ verglichenwerden. Berechnung: Siehe Leonhart (2004), Seite 175ff 11_nonpara 31
Vorzeichentest und Vorzeichenrangtest Vorzeichentest und Vorzeichenrangtest Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxonvergleichen, wie sich die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen zwei abhängigen Stichproben unterscheiden. Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die höhere Power und ist daher generell zu bevorzugen. Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-stufiges Rating vor und nach der Maßnahme erfasst. Berechnung: Siehe Leonhart (2004), Seite 172ff 11_nonpara 32
Friedman-Test Der Friedman-Test Der Friedman-Test vergleicht die Merkmalsausprägung eines ordinalskalierten Merkmals zwischen mehr als zwei abhängigen Stichproben. Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe einer Reha-Maßnahme verbessert hat. Dabei wird die Arbeitsfähigkeit als 5-Stufiges Rating zu 3 Messzeitpunkten erfasst (prä-, post-, follow-up - Erhebung). Berechnung: Siehe Leonhart (2004), Seite 177f 11_nonpara 33
Zusammenfassung • Nonparametrische Testverfahren können eingesetzt werden, wenn • die vorliegenden Daten kein Intervallskalenniveau aufweisen oder • die Normalverteilungsannahme der parametrischen Tests verletzt ist. • Der χ²-Test überprüft ob beobachteteund erwartete Häufigkeiten signifikant voneinander abweichen. • Der Kolmogorov-Smirnov-Test prüft, ob eine empirische Verteilung mit einer theoretisch vorgegebenen Verteilungsform (Normalverteilung) übereinstimmt. • Der U-Test vergleicht die mittleren Rangplätze zwischen 2 Gruppen. • Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit der Stichprobe und Anzahl der Gruppen ausgewählt werden 11_nonpara 34