1 / 103

STATISIK

STATISIK. LV Nr.: 0028 SS 2005 30. Mai 2005. Konfidenzintervall. Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1- α ) liegt. Konfidenzintervall.

Download Presentation

STATISIK

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISIK LV Nr.: 0028 SS 2005 30. Mai 2005

  2. Konfidenzintervall • Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.

  3. Konfidenzintervall • Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall

  4. Konfidenzintervall

  5. Konfidenzintervall • Bsp. Körpergröße: • Mittelwert = 173,42 • Standardabweichung = 9,54 • N = 73 • 2-seitiges KI zum Niveau α=0,05 Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t = 1,99, Quantile der N(0,1)-Vt: z = 1,96 KI: [171,19≤ µ ≤175,65] t-Vt. KI: [171,23≤ µ ≤175,61] N(0,1)-Vt.

  6. Statistische Tests • Fragen: • Besteht ein Zusammenhang zw. dem Geschlecht und dem Rauchverhalten? • Ist der Ausschussanteil kleiner als 5%? • Ist die mittlere Länge eines Werkstücks, das von zwei verschiedenen Maschinen hergestellt wird, gleich? • Soll ein neues Medikament zugelassen werden? • Stammen Daten aus einer N-Vt Grundgesamtheit? • …

  7. Statistische Tests • Deskriptive Analyse der Daten • Lage- und Streuungsmassen • Kontingenztafeln • Korrelationsmaße • Verteilungsdiagramme • … • Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen.

  8. Statistische Tests Einführung: • Testen von Hypothesen (Annahmen, Behauptungen) • Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen. • Statistische Testverfahren basieren auf Stichprobentheorie

  9. Statistische Tests Einführung: • Ziel: Richtigkeit von Aussagen über die Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines zufälligen Vorgangs. • Daher: Entscheidungen nicht immer richtig • Aber: Beim Vorliegen einiger der möglichen Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.

  10. Statistische Tests: Hypothesen Hypothesen: • Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit • 2 Arten von Hypothesen: • Parameterhypothesen, Überprüfung durch Parametertests • Verteilungshypothesen, Überprüfung durch Verteilungstests

  11. Statistische Tests: Hypothesen Formulierung von Hypothesen: • Nullhypothese H0 (Ausgangshypothese) • Alternativhypothese H1 (Gegenhypothese)

  12. Statistische Tests: Hypothesen Bsp. • Anteile: • H0: Ausschussanteil = 10% • H1: Ausschussanteil > 10% • Mittelwerte: • H0: Mittlere Länge eines Werkstücks = 5cm • H1: Mittlere Länge eines Werkstücks  5cm • Gruppenvergleich: • H0: Gruppe 1 und Gruppe 2 sind gleich • H1: Gruppe 1 und Gruppe 2 sind ungleich

  13. Statistische Tests • Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn • Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht. • Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?

  14. Statistische Tests Mögliche Fehlentscheidungen: • Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt • Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt.

  15. Statistische Tests • Fehlentscheidungen

  16. Statistische Tests Problem bei Fehlentscheidungen: • Falsche Entscheidung • Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist.

  17. Statistische Tests • Signifikanzniveau eines Testsα: • Die Wahrscheinlichkeit eine Fehler 1. Art zu machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.

  18. Statistische Tests • Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt). • Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).

  19. Statistische Tests

  20. Statistische Tests • D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert. • Bei Entscheidung für H1: • H1 ist richtig, • H1 ist falsch, ich mache einen Fehler mit Wahrscheinlichkeit ≤ α. • Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.

  21. Statistische Tests • Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. • Fehler 1. Art: das Medikament wirkt nicht, man glaubt aber dass es wirkt • Fehler 2. Art: das Medikament wirkt, man glaubt aber dass es unwirksam ist. Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.

  22. Statistische Tests • Arten von Hypothesen: • Einseitige Hypothesen • H0: θ≤θ0 gegen H1: θ > θ0 • H0: θ≥θ0 gegen H1: θ < θ0 • Zweiseitige Hypothesen • H0: θ = θ0 gegen H1: θ ≠ θ0 • Verteilungshypothesen: • H0: bestimmten Vt. gegen H1: nicht diese Vt.

  23. Statistische Tests • Arten von Testproblemen: • Einseitige Testprobleme • Tests für einseitige Hypothesen • Zweiseitige Testprobleme • Tests für zweiseitige Hypothesen • Anpassungstests • Test für Verteilungshypothesen

  24. Statistische Tests • Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist. • Test zum Niveau α: • g(θ) ≤ α für alle θ H0 • g(θ) ≥ α für alle θ H1 • Ist θH1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art. • Funktion 1-g(θ) heißt Operationscharakteristik (OC)

  25. Statistische Tests

  26. Statistische Tests

  27. Statistische Tests • Trennschärfe eines Tests: • Steilheit der OC Kurve 1-g(θ) • Es gilt: Je größer die Stichprobe umso besser die Trennschärfe.

  28. Statistische Tests

  29. Statistische Tests • Vorgehensweise bei statistischen Tests (I): • Formulierung von H0 und H1 und Festlegen des Signifikanzniveaus • Festlegung einer geeigneten Prüfgröße und Bestimmung der Testverteilung unter H0. • Bestimmung des kritischen Bereichs • Berechnung der Prüfgröße (=Teststatistik) • Entscheidung und Interpretation

  30. Statistische Tests • Vorgehensweise bei statistischen Tests (II): • Formulierung von H0 und H1 und Festlegen des Signifikanzniveaus • Festlegung einer geeigneten Prüfgröße und Bestimmung der Testverteilung unter H0. • Berechnung der Prüfgröße (=Teststatistik) • Bestimmung des p-Wertes der Teststatistik • Entscheidung und Interpretation

  31. Statistische Tests • p-Wert • Anstatt den kritischen Bereich bzw. die kritischen Werte zu bestimmen, Berechnung des „p-Wertes“. • p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte. • Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α. • Entscheidung: Lehne H0 ab, wenn p-Wert < α

  32. Statistische Tests • Einseitige Tests (I) • H0: θ≤θ0 gegen H1: θ > θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des kritischen Bereichs bzw. des kritischen Werts (c) • T > c, lehne H0 ab • T ≤ c, lehne H0 nicht ab

  33. Statistische Tests

  34. Statistische Tests • Einseitige Tests (II) • H0: θ≤θ0 gegen H1: θ > θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des p-Wertes • p < α, lehne H0 ab • p ≥ α, lehne H0 nicht ab

  35. Statistische Tests

  36. Statistische Tests • Einseitige Tests (I) • H0: θ≥θ0 gegen H1: θ < θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des kritischen Bereichs bzw. des kritischen Werts (c) • T < c, lehne H0 ab • T ≥ c, lehne H0 nicht ab

  37. Statistische Tests

  38. Statistische Tests • Einseitige Tests (II) • H0: θ≥θ0 gegen H1: θ < θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des p-Wertes • p < α, lehne H0 ab • p ≥ α, lehne H0 nicht ab

  39. Statistische Tests

  40. Statistische Tests • Zweiseitige Tests (I) • H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des kritischen Bereichs bzw. der kritischen Werte (cu und co) • T < cu oder T > co, lehne H0 ab • cu ≤ T ≤ co, lehne H0 nicht ab

  41. Statistische Tests

  42. Statistische Tests • Zweiseitige Tests (II) • H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05 • Teststatistik (T) und deren Verteilung unter H0bestimmen. • Bestimmung des p-Wertes • p < α, lehne H0 ab • p ≥ α, lehne H0 nicht ab

  43. Statistische Tests

  44. Statistische Tests • Kritischer Wert: Wert auf der Achse • p-Wert: Fläche unter der Dichte • Entscheidung: • Lehne H0 ab, wenn Prüfgröße im kritischen Bereich • Lehen H0 ab, wenn p-Wert der Prüfgröße < α

  45. χ² Unabhängigkeitstest Chi-Quadrat (χ²) Unabhängigkeitstest • Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind. • Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig?

  46. χ² Unabhängigkeitstest Chi-Quadrat (χ²) Unabhängigkeitstest • H0: die beiden Merkmale sind voneinander unabhängig. • H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig • Festlegen des Signifikanzniveaus α.

  47. χ² Unabhängigkeitstest • Kontingenztafel: • Absolute Häufigkeiten der Merkmalsausprägungen

  48. χ² Unabhängigkeitstest • Bsp. 4-Felder Tafel: • Absolute Häufigkeiten der Merkmalsausprägungen

  49. χ² Unabhängigkeitstest Prüfgröße und Testverteilung: • Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho). • Wenn H0 gilt, welche Werte würde man erwarten? • Berechung der unter H0erwarteten absoluten Häufigkeiten.

  50. χ² Unabhängigkeitstest • Unter H0 erwartete absoluten Häufigkeiten • Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten • Dann: unter H0 erwartete absoluten Häufigkeiten

More Related