200 likes | 363 Views
Testen von Hypothesen II. Durchführung eines Experimentes. Anhand der folgenden Liste wird verdeutlicht, welche Aspekte statistischer Tests in der Planungs-, aber auch in der Durchführungsphase einer Studie berücksichtigt werden müssen: Planungsphase eines Experimentes
E N D
Testen von Hypothesen II
Durchführung eines Experimentes • Anhand der folgenden Liste wird verdeutlicht, welche Aspekte statistischer Tests in der Planungs-, aber auch in der Durchführungsphase einer Studie berücksichtigt werden müssen: • Planungsphase eines Experimentes • Wahl der Zielgröße und damit Festlegung des statistischen Modells bzw. Testverfahrens • Formulieren der Null- und Alternativhypothese • Wahl des Signifikanzniveaus • Fallzahlplanung
Durchführung eines Experimentes • 2. Durchführungsphase des Experimentes • Datenerhebung • Datenüberprüfung • 3. Auswertungsphase der Daten bzw. Ergebnisse des Experimentes • Überprüfen der Modellvoraussetzungen • Berechnen der Prüfgröße • Formulieren und Begründen der Testentscheidung • Interpretieren der Testentscheidung hinsichtlich der gewählten Hypothese
Einteilung von Tests • Sollen bestimmte Hypothesen mit Hilfe statistischer Tests überprüft werden, so hängt die Auswahl eines speziellen Testverfahrens von folgenden Faktoren ab : • der zu prüfenden Hypothese • Informationen über die vorliegende(n) Stichprobe(n) • der Beantwortung bestimmter Fragen bevor eine Entscheidung über die Auswahl eines Tests getroffen werden kann:
Einteilung von Tests • Was ist die Aufgabe des Tests? • Vergleich von Erwartungswerten • Vergleich von Varianzen • Vergleich von Häufigkeiten • Prüfung von Verteilungseigenschaften • b. Wie viele Stichproben gehen in den Test ein? • eine • zwei • mehr als zwei
Einteilung von Tests c. Sind die Stichproben voneinander unabhängig (unverbunden)? • d. Gibt es begründete Annahmen darüber, welchen Verteilungsgesetzen die zu untersuchende Größe folgt? • Binominalverteilung • Normalverteilung • Lognormalverteilung • andere • unbekannt
Auswahl statistischer Testverfahren im Hinblick auf die Zielsetzung *Quotient aus der Wahrscheinlichkeit, dass ein Ereignis eintritt und der Wahrscheinlichkeit, dass es nicht eintritt.
Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Ausgangspunkt bilden zwei qualitative Merkmale mit je zwei Ausprägungen. • Die Häufigkeiten für das Auftreten der vier Merkmals-kombinationen in einer Stichprobe vom Umfang n werden tabellarisch in einer 2x2 oder Vierfeldertafel zusammengefasst. • Beispiel: bei 101 Patienten wurden primäre Non-Hodgkin-Lymphome des Magens im Stadium I und II diagnostiziert. • Alle Patienten wurden mindestens 2 Jahre nachbeobachtet. • Von 21 Patienten mit Non-Hodgkin-Lymphomen im Stadium I überlebten 8 die ersten zwei Jahre nach Erkrankung nicht. • Von den 80 im Stadium II Erkrankten überlebten 59 die ersten zwei Jahre nach Erkrankung nicht. • Daraus ergibt sich folgende Vierfeldertafel:
Vierfeldertafel der beobachteten Häufigkeiten primärer Non-Hodgekin-Lymphome des Magens in Abhängigkeit vom Stadium I und II bei 101 Patienten
Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Es soll nun die Frage beantwortet werden, ob der Anteil der Patienten, die weniger als 2 Jahre überleben, unabhängig vom Stadium des Patienten ist. • Damit lautet die Nullhypothese: Die „Anteile“ (Wahrscheinlichkeiten) der Patienten, die 2 Jahre im Stdium I bzw. II überleben, sind gleich. • Bezeichnet pI den Anteil der Patienten (in der Gesamtheit aller primären Non-Hodgkin-Lymphom-Patienten), die im Stadium I weniger als 2 Jahre überleben, so lassen sich die Hypothesen wahrscheinlichkeitstheoretisch wie folgt formulieren: • H0: pI = pIIversus H1: pIpII
Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Wäre pI = pII,so müsste der erwartete Anteil der früh verstorbenen Patienten (Überleben < 2 Jahre) in den Stadien I bzw. II auch gleich dem Anteil in der Gesamtstichprobe sein. • Aus der Tabelle (siehe Chart 9) ergibt sich eine Schätzung von 67/101 (= 0,6637) für den Anteil der früh Verstorbenen in der Gesamtstichprobe. • Davon ausgehend würden im Stadium I also 21 x 67/101(= 13,93) und im Stadium II 80 x 67/101 (= 53,07) Patienten erwartet. • Die folgende Tabelle enthält die erwarteten Häufigkeiten:
Vierfeldertafel der erwarteten Häufigkeiten primärer Non-Hodgekin-Lymphome des Magens in Abhängigkeit vom Stadium I und II bei 101 Patienten
Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Ähnlich wie bei der Kleinsten-Quadrat-Schätzung im Fall der linearen Regression verwendet man zur Quantifizierung der Abweichung zwischen beobachteten und erwarteten Häufigkeiten das Quadtrat der Differenzen. • Allerdings kommt z.B. einer Abweichung der erwarteten Häufigkeit 6 von der beobachteten Häufigkeit 12 eine andere Bedeutung zu als einer Abweichung von 106 zu 112. • Um dies zu berücksichtigen, werden die quadrierten Differenzen durch die erwarteten Häufigkeiten dividiert (normiert). • Als Gesamtmaß für die Abweichung zwischen den erwarteten und beobachteten Häufigkeiten dient die Summe der normierten quadratischen Differenzen (Prüfgröße des Vierfeldertests).
(59 – 53,07)2 (13 – 7,07)2 (21 – 26,93)2 (8 – 13,93)2 + + + 53,07 7,07 26,93 13,93 (5,93)2 (5,93)2 (- 5,93)2 (- 5,93)2 + + + = 53,07 7,07 26,93 13,93 35,15 35,15 35,15 35,15 + + + = 53,07 7,07 26,93 13,93 + + + 0,66 4,97 1,31 = 2,52 = 9,46 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Das ergibt in unserem Beispiel:
Für die 2x2-Tafel ist die Prüfgröße bei Zutreffen der Nullhypothese annähernd 2-verteilt mit einem Freiheitsgrad (2), wenn die erwarteten Häufigkeiten nicht zu klein werden( 4). 1 (beobachtete Hfk. – erwartete Hfk.)2 erwartete Hfk. Alle Felder Vierfeldertest (Chi-Quadrat-Test, 2-Test • Diese Prinzip lässt sich auch auf die Untersuchung größerer Kontingenztafeln anwenden. • Als Prüfgröße des 2-Tests ergibt sich dann:
Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Liegt eine Kontingenztafel mit k Spalten und m Zeilen vor, so ist die entsprechende Prüfgröße 2-verteilt mit (k –1) (m – 1) Freiheitsgraden. • Die folgende Tabelle (Chart 17) enthält -Quantile der 2-Verteilung.
2 (0,95) 9,46 > 3,84 = 1 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Der kritische Wert für das Signifikanzniveau von 5% ( = 0,05) beträgt 3,84. • Damit ist [0, 3,84] der 5%-Annahmebereich und entsprechend [3,84, ] der 5%-Ablehnbereich des 2-Tests für Vierfeldertafeln. • Der Wert der oben berechneten Prüfgröße liegt im Ablehnbereich, denn
9,46 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Das Ergebnis wird so interpretiert, dass das Krankheitsstadium einen Einfluss auf die Überlebensdauer der Patienten hat (die Nullhypothese wird verworfen), und zwar ist das Stadium I für die 2-Jahres-Überlebensrate prognostisch günstiger. • Der p-Wert des 2-Tests, der auf dem Wert 9,46 der Prüfgröße basiert, lässt sich numerisch ermitteln. • Da der p-Wert 0,0042 beträgt und damit kleiner als 0,05 ist, muss die Nullhypothese gleicher Anteile verworfen werden.
n (a • d – b • c)2 (a + b) (a + c) (c + d) (b + d) Vierfeldertest (Chi-Quadrat-Test, 2-Test • Bemerkung; Durch algebraische Umformungen lässt sich im Fall der 2x2-Tafel die Prüfgröße einfacher nach der folgenden Formel berechnen: • Anhand dieser Prüfgröße ergibt sich für das Beispiel 9,47 für die Prüfgröße. • Die Abweichung zu 9,46 entsteht durch Rundungen innerhalb der beiden Rechengänge.