1 / 20

Testen von Hypothesen II

Testen von Hypothesen II. Durchführung eines Experimentes. Anhand der folgenden Liste wird verdeutlicht, welche Aspekte statistischer Tests in der Planungs-, aber auch in der Durchführungsphase einer Studie berücksichtigt werden müssen: Planungsphase eines Experimentes

Download Presentation

Testen von Hypothesen II

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Testen von Hypothesen II

  2. Durchführung eines Experimentes • Anhand der folgenden Liste wird verdeutlicht, welche Aspekte statistischer Tests in der Planungs-, aber auch in der Durchführungsphase einer Studie berücksichtigt werden müssen: • Planungsphase eines Experimentes • Wahl der Zielgröße und damit Festlegung des statistischen Modells bzw. Testverfahrens • Formulieren der Null- und Alternativhypothese • Wahl des Signifikanzniveaus • Fallzahlplanung

  3. Durchführung eines Experimentes • 2. Durchführungsphase des Experimentes • Datenerhebung • Datenüberprüfung • 3. Auswertungsphase der Daten bzw. Ergebnisse des Experimentes • Überprüfen der Modellvoraussetzungen • Berechnen der Prüfgröße • Formulieren und Begründen der Testentscheidung • Interpretieren der Testentscheidung hinsichtlich der gewählten Hypothese

  4. Einteilung von Tests • Sollen bestimmte Hypothesen mit Hilfe statistischer Tests überprüft werden, so hängt die Auswahl eines speziellen Testverfahrens von folgenden Faktoren ab : • der zu prüfenden Hypothese • Informationen über die vorliegende(n) Stichprobe(n) • der Beantwortung bestimmter Fragen bevor eine Entscheidung über die Auswahl eines Tests getroffen werden kann:

  5. Einteilung von Tests • Was ist die Aufgabe des Tests? • Vergleich von Erwartungswerten • Vergleich von Varianzen • Vergleich von Häufigkeiten • Prüfung von Verteilungseigenschaften • b. Wie viele Stichproben gehen in den Test ein? • eine • zwei • mehr als zwei

  6. Einteilung von Tests c. Sind die Stichproben voneinander unabhängig (unverbunden)? • d. Gibt es begründete Annahmen darüber, welchen Verteilungsgesetzen die zu untersuchende Größe folgt? • Binominalverteilung • Normalverteilung • Lognormalverteilung • andere • unbekannt

  7. Auswahl statistischer Testverfahren im Hinblick auf die Zielsetzung *Quotient aus der Wahrscheinlichkeit, dass ein Ereignis eintritt und der Wahrscheinlichkeit, dass es nicht eintritt.

  8. Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Ausgangspunkt bilden zwei qualitative Merkmale mit je zwei Ausprägungen. • Die Häufigkeiten für das Auftreten der vier Merkmals-kombinationen in einer Stichprobe vom Umfang n werden tabellarisch in einer 2x2 oder Vierfeldertafel zusammengefasst. • Beispiel: bei 101 Patienten wurden primäre Non-Hodgkin-Lymphome des Magens im Stadium I und II diagnostiziert. • Alle Patienten wurden mindestens 2 Jahre nachbeobachtet. • Von 21 Patienten mit Non-Hodgkin-Lymphomen im Stadium I überlebten 8 die ersten zwei Jahre nach Erkrankung nicht. • Von den 80 im Stadium II Erkrankten überlebten 59 die ersten zwei Jahre nach Erkrankung nicht. • Daraus ergibt sich folgende Vierfeldertafel:

  9. Vierfeldertafel der beobachteten Häufigkeiten primärer Non-Hodgekin-Lymphome des Magens in Abhängigkeit vom Stadium I und II bei 101 Patienten

  10. Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Es soll nun die Frage beantwortet werden, ob der Anteil der Patienten, die weniger als 2 Jahre überleben, unabhängig vom Stadium des Patienten ist. • Damit lautet die Nullhypothese: Die „Anteile“ (Wahrscheinlichkeiten) der Patienten, die 2 Jahre im Stdium I bzw. II überleben, sind gleich. • Bezeichnet pI den Anteil der Patienten (in der Gesamtheit aller primären Non-Hodgkin-Lymphom-Patienten), die im Stadium I weniger als 2 Jahre überleben, so lassen sich die Hypothesen wahrscheinlichkeitstheoretisch wie folgt formulieren: • H0: pI = pIIversus H1: pIpII

  11. Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Wäre pI = pII,so müsste der erwartete Anteil der früh verstorbenen Patienten (Überleben < 2 Jahre) in den Stadien I bzw. II auch gleich dem Anteil in der Gesamtstichprobe sein. • Aus der Tabelle (siehe Chart 9) ergibt sich eine Schätzung von 67/101 (= 0,6637) für den Anteil der früh Verstorbenen in der Gesamtstichprobe. • Davon ausgehend würden im Stadium I also 21 x 67/101(= 13,93) und im Stadium II 80 x 67/101 (= 53,07) Patienten erwartet. • Die folgende Tabelle enthält die erwarteten Häufigkeiten:

  12. Vierfeldertafel der erwarteten Häufigkeiten primärer Non-Hodgekin-Lymphome des Magens in Abhängigkeit vom Stadium I und II bei 101 Patienten

  13. Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Ähnlich wie bei der Kleinsten-Quadrat-Schätzung im Fall der linearen Regression verwendet man zur Quantifizierung der Abweichung zwischen beobachteten und erwarteten Häufigkeiten das Quadtrat der Differenzen. • Allerdings kommt z.B. einer Abweichung der erwarteten Häufigkeit 6 von der beobachteten Häufigkeit 12 eine andere Bedeutung zu als einer Abweichung von 106 zu 112. • Um dies zu berücksichtigen, werden die quadrierten Differenzen durch die erwarteten Häufigkeiten dividiert (normiert). • Als Gesamtmaß für die Abweichung zwischen den erwarteten und beobachteten Häufigkeiten dient die Summe der normierten quadratischen Differenzen (Prüfgröße des Vierfeldertests).

  14. (59 – 53,07)2 (13 – 7,07)2 (21 – 26,93)2 (8 – 13,93)2 + + + 53,07 7,07 26,93 13,93 (5,93)2 (5,93)2 (- 5,93)2 (- 5,93)2 + + + = 53,07 7,07 26,93 13,93 35,15 35,15 35,15 35,15 + + + = 53,07 7,07 26,93 13,93 + + + 0,66 4,97 1,31 = 2,52 = 9,46 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Das ergibt in unserem Beispiel:

  15. Für die 2x2-Tafel ist die Prüfgröße bei Zutreffen der Nullhypothese annähernd 2-verteilt mit einem Freiheitsgrad (2), wenn die erwarteten Häufigkeiten nicht zu klein werden( 4). 1 (beobachtete Hfk. – erwartete Hfk.)2  erwartete Hfk. Alle Felder Vierfeldertest (Chi-Quadrat-Test, 2-Test • Diese Prinzip lässt sich auch auf die Untersuchung größerer Kontingenztafeln anwenden. • Als Prüfgröße des 2-Tests ergibt sich dann:

  16. Vierfeldertest (Chi-Quadrat-Test, 2-Test) • Liegt eine Kontingenztafel mit k Spalten und m Zeilen vor, so ist die entsprechende Prüfgröße 2-verteilt mit (k –1) (m – 1) Freiheitsgraden. • Die folgende Tabelle (Chart 17) enthält -Quantile der 2-Verteilung.

  17. Quantile der 2 () der 2-Verteilung FG

  18. 2 (0,95) 9,46 > 3,84 = 1 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Der kritische Wert für das Signifikanzniveau von 5% ( = 0,05) beträgt 3,84. • Damit ist [0, 3,84] der 5%-Annahmebereich und entsprechend [3,84, ] der 5%-Ablehnbereich des 2-Tests für Vierfeldertafeln. • Der Wert der oben berechneten Prüfgröße liegt im Ablehnbereich, denn

  19.  9,46 Non-Hodgekin-Lymphome in Abhängigkeit vom Stadium • Das Ergebnis wird so interpretiert, dass das Krankheitsstadium einen Einfluss auf die Überlebensdauer der Patienten hat (die Nullhypothese wird verworfen), und zwar ist das Stadium I für die 2-Jahres-Überlebensrate prognostisch günstiger. • Der p-Wert des 2-Tests, der auf dem Wert 9,46 der Prüfgröße basiert, lässt sich numerisch ermitteln. • Da der p-Wert 0,0042 beträgt und damit kleiner als 0,05 ist, muss die Nullhypothese gleicher Anteile verworfen werden.

  20. n (a • d – b • c)2 (a + b) (a + c) (c + d) (b + d) Vierfeldertest (Chi-Quadrat-Test, 2-Test • Bemerkung; Durch algebraische Umformungen lässt sich im Fall der 2x2-Tafel die Prüfgröße einfacher nach der folgenden Formel berechnen: • Anhand dieser Prüfgröße ergibt sich für das Beispiel 9,47 für die Prüfgröße. • Die Abweichung zu 9,46 entsteht durch Rundungen innerhalb der beiden Rechengänge.

More Related