1 / 21

Statistik: 11.11.04

Statistik: 11.11.04. Konfidenzintervall und Testen für den Mittelwert und Anteile. Schließende Statistik. oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter ( m , p , etc.)

Download Presentation

Statistik: 11.11.04

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Statistik: 11.11.04 Konfidenzintervall und Testen für den Mittelwert und Anteile

  2. Schließende Statistik oder Statistische Inferenz: Rückschluss aus den Ergebnissen einer Zufallsstichprobe auf die Grundgesamtheit oder ihre Parameter (m, p, etc.) • Das Schätzen von Parametern: für den unbekann-ten Wert eines Parameters (m, p, etc.) ist zu bestimmen • ein numerischer Wert (Punktschätzer) oder • ein Intervall, in dem der unbekannte Wert mit vorgegebener Wahrscheinlichkeit enthalten ist (Konfidenzintervall) • Entscheidung zwischen Behauptungen (Hypothesen) PI Statistik, WS 2004/05 (8)

  3. Beispiel A: Abfüllmenge • Der unbekannte Mittelwert μder Füllmenge soll geschätzt werden • Stichprobe (n = 25): = 126.7, s = 0.5. • Punktschätzer für μ ist • Konfidenzintervall für μ: ±c. • Testen von H0: μ = 126.4 gegen H1: μ > 126.4 PI Statistik, WS 2004/05 (8)

  4. Beispiel B: Anteil der Berufstätigen unter Studierenden • Anteilθist unbekannt • Stichprobe (n = 200) gibt Anteil von p = 32% • Punktschätzer fürθist p = 0.32 • Konfidenzintervall p ± c • Testen die Nullhypothese H0:θ= 0.20 gegen H1: µ >0.20 PI Statistik, WS 2004/05 (8)

  5. Stichprobenverteilungen • Wahrscheinlichkeitsverteilungen von und p sind Basis von statistischen Entscheidungsverfahren • Zentraler Grenzwertsatz PI Statistik, WS 2004/05 (8)

  6. Stichprobenmittelwert • Grundgesamtheit: X mit (beliebiger) Verteilung,  und . • Stichprobenmittelwert : • Mittelwert von ist  • Standardabweichung (Standardfehler, standard error) von ist StdAbw( ) = /n • Für nicht zu kleines n: ist näherungsweise normalverteilt PI Statistik, WS 2004/05 (8)

  7. Konfidenzintervall für μ • Konfidenzintervall zur Konfidenzzahlγ • Mit γ = 0.95 c = 2/n genauer: c = 1.96 /n • 99.7%-iges KI:±3 /n • 90%-iges KI:±1.645/n PI Statistik, WS 2004/05 (8)

  8. Beispiel A: Abfüllmenge • Stichprobe (n = 25): = 126.7, s = 0.5. • Punktschätzer für μ ist = 126.7 • 95%-iges Konfidenzintervall für μ: • Einsetzen gibt • oder: 126.5 ≤ m ≤ 126.9 PI Statistik, WS 2004/05 (8)

  9. Konfidenzintervall: Wahl von c • Näherungsweise gilt • Wahl von c0 so, dass oder • Aus folgt und das 0.975-Perzentil c0 = 1.96 PI Statistik, WS 2004/05 (8)

  10. 100g%iges Konfidenzintervall für μ Symmetrisches Intervall um so, dass 100g% aller so konstruierten Intervalle das wahre m enthalten Wahl von z für gegebenes g : PI Statistik, WS 2004/05 (8)

  11. Wahl des Stichprobenumfanges • Halbe Länge c des Konfidenzintervalls hängt ab von n, g und s • Bei Vorgabe von c und g kann n berechnet werden: n =(z(1+g)/2σ/c)2 PI Statistik, WS 2004/05 (8)

  12. Unbekanntes s • Verwendung der t -Verteilung statt der standardisierten Normalverteilung • Student‘sche t -Verteilung: • hat einen Parameter (n-1), die „Zahl der Freiheitsgrade“ • tabelliert, in EXCEL: Funktionen TVERT, TINV • symmetrisch, glockenförmig • für wachsendes n der Normalverteilung immer ähnlicher PI Statistik, WS 2004/05 (8)

  13. t -Verteilung: Perzentile p-Quantile der t -Verteilung für wachsende Zahl der Freiheitsgrade und der Normalverteilung PI Statistik, WS 2004/05 (8)

  14. Test für μ Verfahren • Lege die Nullhypothese H0 (μ = μ0) und die Alternative H1 fest • Wähle den maximal tolerierten p-Wert (probability value), d.i. die Wahrscheinlichkeit, den Fehler 1. Art zu begehen (das Signifikanzniveau, auch mit  bezeichnet); z.B. 0.05 • Ziehe die Stichprobe, berechne • Berechne den p-Wert • Verwerfe H0, wenn der p -Wert kleiner als  ist PI Statistik, WS 2004/05 (8)

  15. Beispiel A: Abfüllmenge • Nullhypothese H0:μ= 125g • Alternative H1:μ> 125g • Die Entscheidung soll für a = 0.05 getroffen werden • Stichprobe (n = 9): = 126.0, s = 1.5 • Wir verwerfen H0! PI Statistik, WS 2004/05 (8)

  16. Testen von Hypothesen • Methode, auf Basis einer Zufallsstichprobe eine Entscheidung zwischen zwei Behauptungen (Vermutungen) zu treffen • Nullhypothese H0: ist jene Vermutung, über die entschieden werden soll (z.B. m = 125) • Alternativhypothese: eine konkurrierende Vermutung • p -Wert: Wahrscheinlichkeit, den erhaltenen oder einen noch extremeren Wert für die Teststatistik zu erhalten, wenn H0 zutrifft; ein Maß für die Glaubwürdigkeit von H0 • Fehlentscheidungen: • Fehler 1. Art (a-Fehler): richtige H0 wird nicht akzeptiert; der p -Wert ist die Wahrscheinlichkeit, diesen Fehler zu begehen • Fehler 2. Art: zutreffende Alternativhypothese wird nicht akzeptiert • Signifikanzniveau a: maximal tolerierter p -Wert PI Statistik, WS 2004/05 (8)

  17. Wahl der Alternativhypothese • Das, was ich „beweisen“ möchte • Beispiel: Abfüllmenge; H0: m=125g • Konsumentenschützer möchte erkennen, wenn m<125g; • er möchte ziemlich sicher sein, dass er recht hat, wenn er „m<125g“ behauptet • Test mit Signifikanzniveau a=0.05: er irrt höchstens in 5 von 100 Entscheidungen • Analog: Produzent möchte erkennen, wenn m>125g oder wenn m≠125g PI Statistik, WS 2004/05 (8)

  18. Inferenz bei Anteilen • Schätzwert für Anteil aus Stichprobe (Umfang n): relative Häufigkeit pn • Stichprobenverteilung von pn (Zentraler Grenzwert-satz): • mit • Faustregel für „großes n'': n q > 5, n (1-q) > 5 PI Statistik, WS 2004/05 (8)

  19. 100g%iges Konfidenzintervall für q Symmetrisches Intervall um pn so, dass 100g% aller so konstruierten Intervalle das wahre q enthalten Wahl von z für gegebenes g : In sp ist q durch pn zu ersetzen! PI Statistik, WS 2004/05 (8)

  20. Beispiel B: Berufstätige • Anteil derBerufstätigen unter den Studierendenθist unbekannt • Stichprobe (n = 200) gibt Anteil von p200 = 32% • Punktschätzer fürθist p = 0.32 • 95%-iges Konfidenzintervall für θ: oder: 0.255 ≤ θ ≤ 0.385 Achtung! nθ ≈ 200 (0.32) = 64 > 5, n(1-θ) ≈ 200 (0.68) = 136 > 5 PI Statistik, WS 2004/05 (8)

  21. Beispiel B: Berufstätige • Nullhypothese H0:θ= 30% • Alternative H1:μ> 30% • Die Entscheidung soll für a = 0.05 getroffen werden • Stichprobe (n = 200): p200 = 0.32 • Wir verwerfen H0 nicht! Beachten Sie! PI Statistik, WS 2004/05 (8)

More Related