1 / 99

Grundgesamtheit – Stichprobe

Grundgesamtheit – Stichprobe. Grundgesamtheit: z.B. alle schweizer WählerInnen Stichprobe: 1 ‘ 000 repräsentative WählerInnen. Stichproben.

ping
Download Presentation

Grundgesamtheit – Stichprobe

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Grundgesamtheit – Stichprobe • Grundgesamtheit: z.B. alle schweizer WählerInnen • Stichprobe: 1‘000 repräsentative WählerInnen

  2. Stichproben • Eine Forscherin entwickelt ein neues Medikament. Bei einem Test an 10 Personen, bewirkt der neue Stoff bei 7 Personen eine Verbesserung. Bei den traditionellen Medikamenten tritt eine positive Wirkung „nur“ bei 50% der Behandlungen ein. • Weist die Untersuchung der Forscherin eine signifikante Messung auf oder ist sie zufällig?

  3. Natürliche Streuung • Wenn man 10 mal eine Münze wirft, dann müsste man der Wahrscheinlichkeit gemäss 5 mal „Zahl“ und 5 mal „Kopf“ werfen. Das ist aber unwahrscheinlich! • Das Gleiche gilt bei Medikamenten, wenn bei 50% der Patienten eine Wirkung eintritt. Wenn man 10 Patienten das Medikament gibt, wirkt es nicht zwingend jedes Mal bei 5 und bei 5 nicht.

  4. Ein Versuch

  5. Aufgabe Öffnet den Datenset binomial_würfe.sav • Berechnet die Anzahl Fälle >=70 und davon abgeleitet, wieviel Prozent das sind • Macht das Gleiche für alle Fälle >=70 oder <=30

  6. Eine kleine Rechnung • Von unseren 50 Wurfserien sind 9 mit einem Wert >= 70 • 9/0.5 = 18 • In 18% der Fälle liegt der Wert durch zufällige Streuung im Bereich >= 70

  7. Eine kleine Rechnung II • Von unseren 50 Wurfserien sind 19 mit einem Wert >= 70 oder <= 30 • 19/0.5 = 38 • In 38% der Fälle liegt der Wert durch zufällige Streuung im Bereich >= 70 oder <= 30

  8. Bedeutung • Wenn in 38% der Fälle ein Wert zufällig >= 70 oder <= 30 sein kann, ist das neue Medikament weder besser noch schlechter als die bestehenden Medikamente, mit einer Heilungschance von 50%

  9. Binomialtest • Script S. 209 • Stichprobengrösse • Einmal Samplesize 10, einmal 40 (simul.sav)

  10. Normalverteilung Fläche = 1

  11. Beispiel von youtube • www.youtube.com • Key: normal distribution

  12. Prob =.683 Prob = .954 Prob = .997 Normalverteilung II

  13. Werte können in einer Tabelle abgelesen werden Die schraffierte Fläche repräsentiert die Wahrscheinlichkeit eines Z-Wertes >= .5 Fläche = .3085 z = 0.5

  14. Berechnen des z-Wertes • Bsp. IQ (iq.sav) Z-Wert für 75: (75-99.19)/13.52 = -1.79

  15. Aufgabe: Z-Werte Datensatz iq.sav • Errechnet die neue Variable ziq gemäss der Formel

  16. Stichproben • Script S. 219 • Beispiel cholest_stichproben.sav

  17. P für Cholestrinwert <= 193 • Z = 193-205/34.83 = -0.345 • P nach Tabelle = 37%

  18. Verteilung von 500 Stichprobenmittelwerten von Stichproben der Grösse 21

  19. Standardabweichung der Stichprobenmittel = Standard-Fehler Std.Err.= Bsp: 35 / Wurzel(21) = 7.64

  20. Anwendung • Bei gegebenem Mittelwert und Standardabweichung der Grundgesamtheit kann man: • die Wahrscheinlichkeit eines Z-Wertes für Stichproben finden

  21. Z-Wert Mittelwert Stichprobe – Mittelwert Grundgesamtheit z = Standardabweichung Grundgesamtheit

  22. Beispiel: 21 CEOs wurden nach ihrem Cholesteringehalt untersucht, mit dem Ergebnis von 193 mg/dl. Wir wissen, dass in der Bevölkerung der Cholesteringehalt im Mittel 205 mg/dl beträgt, das mit einer Standardabweichung von 35 193 – 205 = -1.57 z = Kontrolle Buch S. 223

  23. Was geschieht, wenn die Standardabweichung der Grundgesamtheit fehlt? Wir wissen vielleicht, dass die Beschäftigten in einem Land im Mittel 40 Stunden arbeiten, kennen aber die Standardaweichung nicht. Buch Norusis, S. 235 f.

  24. T-Statistik • Formel: Stichprobenmittel – Mittel der Grundgesamtheit t = sist die Std.Abw. der Stichprobe Der ganze Teil ist die Std.Abw der Streuung aller möglichen Stichproben = Std.Err. der Stichprobenmittel

  25. Die T-Statistik • Basiert auf der t-Verteilung • Die Verteilung verändert sich nach Anzahl n • Um die richtige Verteilung zu finden, braucht es die Freiheitsgrade

  26. Die Berechnung zum Beispiel ist im Buch auf S. 240 zu finden. T = (47-40)/0.49 = 14.3

  27. T- Verteilung

  28. Degrees of freedom (df) • Die Anzahl von Stichprobenwerten, die frei variieren können Eine Restriktion 10 = 8 6 9 7 Freiheitsgrade = n - 1 ? 40

  29. Ein t-Wert von 14.3? • Was bedeutet dieser Wert bei 436 Freiheitsgraden? • Kontrolle auf Tabelle

  30. Vorgehen in SPSS • S. 240 Script

  31. Histogramm

  32. Ist die Verteilung normal? • Aufgrund des visuellen Eindrucks eher nicht • Überprüfung mit Shapiro-Wilk‘s und Kolmogorov-Smirnov (K-S) Test • -> Explore-Befehl • Script S. 264

  33. Zentraler Grenzwertsatz • Genug grosse Stichproben (Faustregel > 30) streuen in ihren Mittelwerten approximativ normal. Dabei muss die Variable der Gesamtpopulation nicht normal verteilt sein.

  34. Diskussion der Ergebnisse

  35. Konfindenzintervalle I Aufgrund der hohen Signifikanz können wir davon ausgehen, dass die Hochschulabgänger mehr als 40 Stunden arbeiten. Aber: Wieviele Stunden arbeiten sie nun?

  36. Konfidenzintervalle II Aufgrund unserer Daten könnten wir von 47 Stunden ausgehen. Das ist die beste Vermutung, die aus dem Mittel der Stichprobe abgeleitet ist. Aufgrund des Standardfehler wissen wir, dass die Stichproben eine Std.Abw. von .488 haben

  37. Konfidenzintervalle III Im Beispiel haben wir ein 95%-iges Konfidenzintervall. Dh. 95% der Fälle liegen innerhalb von ca. 2 Std.Abw.

  38. Konfidenzintervall IV Jetzt können wir rechnen: 2 x 0.48 = 0.96 Mittelwert von 47 – 0.96 = 46.04 Mittelwert von 47+ 0.96 = 47.96

  39. Aufgaben • Aufg. 2 S. 250 • Aufg. Statistics Coach (brakes.sav)

  40. T-Test mit abhängigen (gepaarten) Stichproben Ausgangslage: • Typischwerweise vorher - nachher

  41. Beispiel Marathonläufer: Ein Team erforschte, ob bei Langstreckenläufer der β-Endorphin-Werte Nach einem Lauf höher sind als vorher. β-Endorphin-Werte vorher nachher diff ________ ________ ________ 4.30 29.60 25.30 4.60 25.10 20.50 5.20 15.50 10.30 5.20 29.60 24.40 6.60 24.10 17.50 7.20 37.80 30.60 8.40 20.20 11.80 9.00 21.90 12.90 10.40 14.20 3.80 14.00 34.60 20.60 17.80 46.20 28.40 Gesamtergebnis Mittelwert 8.43 27.16 18.74 N 11 11 11

  42. Lösungsansatz • Wenn es keinen Unterschied gibt, dann müssen die Mittelwerte von vorher und nachher gleich sein, die Differenz demnach = 0 • Wenn die Differenz stark von 0 abweicht, dann ist der Unterschied nicht mehr zufällig

  43. Umsetzung mit SPSS • T-Test mit einer Stichprobe • T-Test mit gepaarten Stichproben

  44. Aufgabe • Ein Forschungsteam möchte wissen, ob eine Diät erfolgreich war und ob durch die Diät das Tryglyceride-Niveau bei den Partizipienten signifikant gesunken ist. • Datensatz: dietstudy.sav

  45. T-Test mit 2 unabhängigen Stichproben Gaby möchte untersuchen, ob ihre neue Behandlung eine Linderung für Stottern bringt Sie nimmt zwei Gruppen. Die eine bekommt ein Placebo, die andere Gruppe die neue Behandlung. Nach dem Experiment werden alle Testpersonen einem Test unterzogen. Die Stärke des Stotterns wird mit einem Wert 1 bis 10 vergeben, wobei 10 starkes Stottern bedeutet. Datensatz: stottern.sav

  46. Erinnerung • Standardfehler = Dies ist die geschätzte Standardabweichung von allen möglichen gleichen Stichproben, t errechnet sich dann:

  47. Was heisst das für unabhängige Stichproben • Wenn beide Gruppen den gleichen Mittelwert haben, ist die Differenz der Mittel = 0 • Es wird nicht mehr der Standardfehler „des“ Mittelwertes errechnet sondern der Standardfehler der Mittelwert-Unterschiede

  48. In einer Population mit einem Mittel von 0 streuen sich mögliche Stichproben. Eine Differenz von 2 ist gemäss der Darstellung sehr sehr selten.

More Related