390 likes | 948 Views
Der t -Test. Gliederung Statistische Hypothesen Null- und Alternativhypothese Alpha- und Betafehler Statistische Entscheidungen Mittelwertsvergleiche mit dem t -Test Überblick: 3 Arten von t -Tests Stichprobenkennwerteverteilung von Mittelwertsdifferenzen Die t -Verteilung
E N D
Der t-Test 06_ttest(1) 1 Gliederung • Statistische Hypothesen • Null- und Alternativhypothese • Alpha- und Betafehler • Statistische Entscheidungen • Mittelwertsvergleiche mit dem t-Test • Überblick: 3 Arten von t-Tests • Stichprobenkennwerteverteilung von Mittelwertsdifferenzen • Die t-Verteilung • Die Interpretation von t-Werten • Voraussetzungen des t-Tests
Statistische Hypothesen • Die Inferenzstatistik macht Aussagen über eine Population, aus welcher die untersuchten Stichproben gezogen wurden. • Dabei werden statistische Hypothesen getestet. • Statistische Hypothesen sind Erwartungen über Unterschiede zwischen (bzw. Zusammenhänge von) Variablen. • Statistische Hypothesen sollten immer vor einer Untersuchung formuliert werden • Beispiele für statistische Hypothesen: • Frauen sind ängstlicher als Männer. • Es besteht ein negativer Zusammenhang zwischen Ängstlichkeit und Optimismus. • Die Selbstsicherheit von Teilnehmer eines Kommunikationstrainigs ist nach dem Training höher als vor dem Training. 06_ttest(1) 2
Statistische Hypothesen Woher kommen die Hypothesen? • Eine psychologische Untersuchung wird immer mit dem Ziel durchgeführt, eine bestimmte Forschungsfrage zu beantworten. • Beispiel: Wenn ein neues Therapieprogramm entwickelt wurde, dann muss der Entwickler dieses Programms zeigen, dass es den Teilnehmern nach der Therapie besser geht als vorher. • Je nach Ziel des Programms wird eine Hypothese formuliert: • Beispiel: „Teilnehmer weisen in einem Test zur Depressivität nach der Therapie geringere Werte als vor der Therapie auf.“ 06_ttest(1) 3
Nullhypothese und Alternativhypothese • Bei statistischen Tests werden immer (unabhängig von der Erwartung des beteiligten Forschers) zwei gegensätzliche Hypothesen formuliert: • Die Nullhypothese (H0) besagt, dass es keinen Unterschied zwischen zwei Populationen (bzw. keinen Zusammenhang zwischen zwei Merkmalen) gibt. • Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt. • Es kann also immer nur eine von beiden Hypothesen zutreffen! • Die beiden statistischen Hypothesen (H0 und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert. 06_ttest(1) 4
Nullhypothese und Alternativhypothese Es gibt zwei Formen der Alternativhypothese • Eine ungerichtete Alternativhypothese (H1) besagt lediglich, dass es einen Unterschied (bzw. einen Zusammenhang) gibt („zweiseitiger Test“). • Diese Hypothese gilt als bestätigt, • wenn Gruppe 1 größere Werte als Gruppe 2 hat • wenn Gruppe 2 größere Werte als Gruppe 1 hat • (bzw. wenn ein pos. oder ein neg. Zusammenhang zwischen zwei Variablen besteht) • Eine gerichtete Alternativhypothese (H1) spezifiziert die Richtung des Unterschieds (des Zusammenhang) („einseitiger Test“). • Beispiel: Es wird erwartet, • dass Gruppe 1 größere Werte als Gruppe 2 hat. • (bzw. dass ein pos. neg. Zusammenhang zwischen zwei Variablen besteht) 06_ttest(1) 5
Nullhypothese und Alternativhypothese Formale Schreibweise • Ungerichtete Alternativhypothese: • H1: μ1 ≠ μ2 • H0: μ1 = μ2 • Gerichtete Alternativhypothese (1. Möglichkeit): • H1: μ1 > μ2 • H0: μ1 ≤ μ2 • Gerichtete Alternativhypothese (2. Möglichkeit): • H1: μ1 < μ2 • H0: μ1 ≥ μ2 • Die H0 hängt also von der Auswahl der H1 ab! 06_ttest(1) 6
Statistische Hypothesenprüfung Grundgedanke eines statistischen Tests • Bei der statistischen Hypothesenprüfung berechnet, wie wahrscheinlich die empirischen (Mittel-)Werte der Stichprobe sind, wenn in der Population die H0 gilt. • Beispiel: • H0: μLOT, w = μLOT, m (Mittelwert LOT ist für Frauen und Männer gleich) • Gefundenes Ergebnis: • Wie wahrscheinlich ist dieses Ergebnis, wenn die H0 gilt? • Problem: Exakte Werte einer kontinuierlichen Wahrscheinlich-keitsverteilung haben immer die Wahrscheinlichkeit 0. • Lösung: Wie Wahrscheinlich ist es, einen Unterschied von 0.3 oder mehr zu finden, wenn die H0 gilt? • Wenn dies sehr unwahrscheinlich ist, wird die H0verworfen, und die H1 angenommen • Andernfalls wird die H0 beibehalten. 06_ttest(1) 7
Alphafehler und Betafehler Fehler bei der statistischen Entscheidung • Die statistische Entscheidung für die H0 oder die H1 wird aufgrund von Wahrscheinlichkeiten gemacht • Daher sind immer Entscheidungsfehler möglich • Je nach der Entscheidung kann man zwei Fehler machen: • Man entscheidet sich für die H1, obgleich zwischen den Populations-mittelwertenkein Unterschied existiert („α-Fehler“ bzw. „Fehler erster Art“). • Man entscheidet sich für die H0, obgleich es auf Populationsebene einen bedeutsamen Unterschied gibt („β-Fehler“ bzw. „Fehler zweiter Art“). • Für Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden (oft geschieht dies aber nur für den Alpha-Fehler) 06_ttest(1) 8
Alphafehler und Betafehler Das α-Niveau • Das α-Niveau gibt die Wahrscheinlichkeit dafür an, dass ein Test einen bedeutsamen Effekt anzeigt, obwohl in der Population kein Effekt besteht: • Wenn die Wahrscheinlichkeit für den gefundenen Effekt unter der H0 kleiner als α ist, wird die H0 verworfen und die H1 angenommen. • Mit der Wahrscheinlichkeit α wird also die H1fälschlicherweise angenommen. • Konventionen für das α-Niveau: • (p≤ 0.10 „marginal signifikantes“ Ergebnis) • p ≤ 0.05 „signifikantes“ Ergebnis • p≤ 0.01 „hoch signifikantes“ Ergebnis 06_ttest(1) 9
Alphafehler und Betafehler Das β-Niveau • Das β-Niveau gibt an, wie wahrscheinlich es ist, dass ein Test keinen bedeutsamen Effekt anzeigt, obwohl in der Population ein Effekt besteht: • Mit der Wahrscheinlichkeit βwird also die H0fälschlicherweise beibehalten. • Konventionen für das β-Niveau… • … gibt es leider nicht • Es gibt jedoch eigentlich keinen Grund warum β>α sein sollte (obwohl das in vielen Untersuchungen der Fall ist). • β kann im Gegensatz zu α nicht frei gewählt werden, sondern ergibt sich aus verschiedenen anderen Größen (u.a. aus dem gewählten α Niveau und der Stichprobengröße) 06_ttest(1) 10
Statistische Entscheidungen 06_ttest(1) 11
Der t-Test Drei Formen des t-Tests • Der t-Test für unabhängige Stichproben • Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen unterscheiden • Beispiel: „Sind Frauen ängstlicher als Männer?“ • Der t-Test für abhängige Stichproben • Dieser Test prüft, ob sich der Mittelwert einer Stichprobe zu zwei Messzeitpunkten unterscheidet • Beispiel: „Ist der Mittelwert der Ängstlichkeit nach einer Therapie größer als vor der Therapie“ • Der Ein-Gruppen t-Test • Dieser Test prüft, ob sich der Mittelwert einer Gruppe von einem vorgegeben Wert unterscheidet • Beispiel: „Liegt der mittlere IQ einer Gruppe über 100?“ 06_ttest(1) 12
Der t-Test für unabhängige Stichproben Mit dem t-Test für unabhängige Stichproben wird verglichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden. Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus. Daher bildet die Normalverteilung des untersuchten Merkmals eine Voraussetzung für den t-Tests. 06_ttest(1) 13
Kennwert des t-Tests Der Kennwert des t-Tests Der Kennwert des t-Tests ist die Differenz der Mittelwerte der beiden Stichproben: Der t-Test schätzt die bedingte Wahrscheinlichkeit : Wenn p < α, wird die H0 verworfen und die H1angenommen. 06_ttest(1) 14
Stichprobenkennwerteverteilung Die Stichprobenkennwerteverteilung des t-Tests Um die Wahrscheinlichkeit zu bestimmen, wird eine theoretische Stichprobenkennwerteverteilung der Mittelwertsdifferenzenunter der Nullhypothese gebildet. Diese Verteilung gibt an, wie sich empirische Mittelwerts-differenzen verteilen, wenn man sehr oft Stichproben zieht. 06_ttest(1) 15
Stichprobenkennwerteverteilung Stichprobenkennwerteverteilung Wenn die H0 gilt, muss die Stichproben-kennwerteverteilung ihren Gipfel bei 0haben. Die theoretische Verteilung von Mittelwertsdifferenzenist bei großen Stichproben normalverteilt. Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung. Wenn die Verteilung bekannt ist, kann die Wahrscheinlichkeit für bestimmte Wertebereiche als „Fläche unter der Kurve“ bestimmt werden. 06_ttest(1) 16
Stichprobenkennwerteverteilung Der Standardfehler der Stichprobenkennwerteverteilung Der Standardfehler der Stichprobenkennwerteverteilung dest-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab: Der Standardfehler wird benötigt, um die gefundene Mittelwertsdifferenz interpretieren zu können 06_ttest(1) 17
Stichprobenkennwerteverteilung Die t-Verteilung Die empirische Mittelwertsdifferenz wird durch den Standardfehler dividiert. Der resultierende Wert kann nun mit der t-Verteilung verglichen werden. Die genaue For der t-Verteilung hängt von deren Freiheitsgraden (df = degreeoffreedom) ab. 06_ttest(1) 18
Freiheitsgrade Die Freiheitsgrade der t-Verteilung Die Freiheitsgrade der t-Verteilung berechnen sich als: Dabei beeinflussen die Freiheitsgrade die Form der t-Verteilung. Bei vielen Freiheitsgraden (df>120) ist die t-Verteilung nahezu identisch mit der z-Verteilung. Je weniger Freiheitsgrade gegeben sind, desto schmalgipfliger wird die t-Verteilung. 06_ttest(1) 19
Der t-Test für unabhängige Stichproben Entscheidung über die Nullhypothese • Mittels der t-Tabelle wird der empirische t-Wert interpretiert. • Dazu wird ein kritischer t-Wert aus der t-Tabelle entnommen • Der kritische t-Wert häng dabei ab: • von den Freiheitsgraden, • von dem gewählten Alpha-Nivea • von der Art der Testung (einseitig vs. zweiseitig) • Der kritische t-Wert definiert die Grenze des Bereichs für den empirischen t-Wert, ab dem die H0 verworfen wird. 06_ttest(1) 20
Der t-Test für unabhängige Stichproben 06_ttest(1) 21 einseitiger Test(gerichtete H0) zweiseitiger Test(ungerichtete H0)
Der t-Test für unabhängige Stichproben 06_ttest(1) 22 Entscheidungsregeln • Einseitiger Test: • Wenntemp > tkritwird die H0 verworfen • Zweiseitiger Test • Wenn |temp| > tkritwird die H0 verworfen • In der t-Tabelle werden immer Werte für den einseitigen Test angegeben. • Für einen 2-seitigen Test muss tkritso gewählt werden, dass ein Bereich von α/2 „von der Verteilung abgeschnitten wird“
Die t-Verteilung Kritische t-Werte: α = .05, einseitig, df=100: tkrit(100) = 1.66 α = .05, zweiseitig, df=100: tkrit(100) = 1.98 α = .01, einseitig, df=100: tkrit(100) = 2.63 06_ttest(1) 23
Der t-Test für unabhängige Stichproben 06_ttest(1) 24 Arbeitsschritte beim t-Test für unabhängige Stichproben: • Formulierung der (inhaltlichen und statistische) Hypothesen • gerichtet oder ungerichtet? • Erfassung des Merkmals in zwei unabhängigen Stichproben • Berechnung der Mittelwerte in beiden Stichproben • Schätzung der Populationsvarianz • Berechnung des Standardfehlers der Mittelwertsdifferenz • Berechnung des empirischen t-Werts • Bestimmung des kritischen t-Werts • aus df, α, und Art des Tests • Entscheidung für H0oder H1
Voraussetzungen 06_ttest(1) 25 Voraussetzungen des t-Tests für unabhängige Stichproben: • Intervallskalenniveau der Variable • Normalverteilung des Merkmals in der Grundgesamtheit • „Varianzhomogenität“ (Gleiche Varianzen des Merkmals in beiden Populationen) • Unabhängigkeit der Stichproben
Voraussetzungen 06_ttest(1) 26 Normalverteilung des Merkmals in der Grundgesamtheit • Die Normalverteilungsannahme kann statistisch überprüft werden • Dazu dient der Kolmogorov-Smirnov-Test (KS-Test). • Die Verletzung der Normalverteilungsannahme ist vor allem bei kleinen Stichproben problematisch (N<50). • Bei Verletzung der Normalverteilungsannahme sollte ein nicht-parametrisches Test verwenden werden (U-Test). • Solche Verfahren haben aber immer eine höhere β-Fehler Wahrscheinlichkeit, d.h. vorhandene Effekte können oft nicht nachgewiesen werden.
Voraussetzungen 06_ttest(1) 27 Varianzhomogenität • Auch die Varianzhomogenität kann statistisch überprüft werden (Levene-Test). • SPSS prüft die Varianzhomogenität automatisch bei jedemt-Test für unabhängige Stichproben. • Bei einem signifikanten Ergebnis (p < .05), werden die Freiheitsgrade des Tests „korrigiert“.
Zusammenfassung Zu Beginn einer empirischen Untersuchung wird die Nullhypothese (H0) und die Alternativhypothese (H1) formuliert. Ein statistischer Test bezieht sich immer auf die Nullhypothese. Wenn ein empirisches Ergebnis unter der Nullhypothese sehr unwahrscheinlich ist (p<α), wird diese verworfen und damit die H1 angenommen. Mit der Wahrscheinlichkeit α wird also die H1 fälschlicher-weise angenommen (Fehler erster Art) Der Fehler zweiter Art (β-Fehler) besteht darin, die H0 fälschlicherweise anzunehmen. 06_ttest(1) 28
Zusammenfassung Der t-Test für unabhängige Stichproben dient dazu, die Ausprägung eines Merkmales zwischen zwei Gruppen zu vergleichen. Unter Annahme der H0 kann eine theoretische Verteilung für Mittelwertsdifferenzenbestimmt werden. Der empirische t-Wert ergibt sich als empirische Mittel-wertsdifferenz dividiert durch den Standardfehler. Anhand der Anzahl der Freiheitsgrade und des vorher festgelegten α-Niveaus wird ein kritischer t-Wert aus der Tabelle zur t-Verteilung abgelesen. Wenn der empirische t-Wert größer als der kritischer t-Wert ist, wird die H0 verworfen und damit die H1 angenommen. 06_ttest(1) 29
Zusammenfassung Voraussetzung für den t-Tests für unabhängige Stichproben sind (a) Intervallskalenniveau der Variable; (b) Normalverteilung des Merkmals in der Grundgesamtheit (c) „Varianzhomogenität“ und (d) Unabhängigkeit der Stichproben 06_ttest(1) 30