460 likes | 777 Views
TESTS. TESTS. TESTS. TESTS. TESTS. TESTS. TESTS. Worum es geht. Man möchte „testen“, ob eine bestimmte Annahme ( Hypothese ) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Nullhypothese. In der Statistik kann man nie ganz sicher sein.
E N D
TESTS TESTS TESTS TESTS TESTS TESTS TESTS
Worum es geht Man möchte „testen“, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Formulierung einer Hypothese Nullhypothese In der Statistik kann man nie ganz sicher sein. Die „Irrtumswahr- scheinlichkeit“ sollte wenigstens klein sein. Beobachtung (Stichprobe) Vorgabe: „Irrtumswahr- scheinlichkeit“ Entscheidung
TESTS Mathematischer Rahmen I Gegeben sind: Statistische Struktur Diskreter Fall Stetiger Fall Testproblem (Hypothese) Nullhypothese Niveau
TESTS Mathematischer Rahmen II Test gegeben durch: Ablehnungsbereich Teilmenge der Grund- gesamtheit : Menge aller Beobachtungen , die zur Ablehnung der Hypothese führen
TESTS Mathematischer Rahmen III Beobachtung (Stichprobe) Oder Entweder Beobachtung liegt im Annahmebereich Beobachtung liegt im Ablehnungsbereich Hypothese annehmen! Hypothese ablehnen!
Fehler erster und zweiter Art Entschei- dung Hypothese abgelehnt Hypothese akzeptiert Realität Hypothese wahr Fehler 1. Art Hypothese falsch Fehler 2. Art
Niveau und Macht Obere Grenze für die Wahr- scheinlichkeit, einen Fehler 1. Art zu begehen Niveau Macht in einem Punkt der Alter- native 1 - Wahrscheinlichkeit, einenFehler 2. Art zu begehen, wenn der wahre Parameter- wert in dem Punkt liegt
Neyman-Pearson-Test Sei * ein Neyman-Pearson Test vom Niveau : Für einen Test mit gilt immer:
Jeder Test, der vom Niveau eines gegebenen Neyman- Pearson-Tests ist, besitzt höchstens die Macht dieses Neyman-Pearson-Tests.
Tafel für die Verteilungsfunktion bei Normalverteilung
Approximative Konfidenzintervalle im Bernoulli-Fall II Vereinfachungfür großes n (n 100)
Beispiel Kaufhaus-Konzern Kauf würde nicht in Erwägung gezogen Kauf würde in Erwägung gezogen 572 1428
Tafel für die Verteilungsfunktion bei Normalverteilung
Zusammenhang Konfidenzintervalle - Tests Gegeben sei ein Konfidenzintervall C() vom Niveau Für eine einfache Hypothese ist dann mit dem Ablehnungsbereich ein Test vom Niveau gegeben, denn:
Konfidenzintervalle Intervallschätzung Jeder Beobachtung wird ein Intervall C() der reellen Zahlen zugeordnet Niveau Dabei ist die Wahrscheinlichkeit. eine Beobachtung zu machen, für die der wahre Parameter im zugehörigen Intervall liegt, größer oder gleich 1 -
Tafel für die Verteilungsfunktion bei Normalverteilung
Rechenbeispiel Stichprobe vom Umfang n = 5 3.5 7.2 5.0 4.3 7.9 Stichprobenfunktionen
Konfidenzintervalle für diese konkrete Stichprobe 1.Fall 2.Fall 3.Fall 4.Fall 18.28 5.Fall 6.Fall
Beispiel Gewicht vonÄpfeln Gewicht von Äpfeln der Sorte Cox-Orange aus einem bestimmten italienischen Anbaugebiet
Konfidenzintervalle für diese konkrete Stichprobe 2.Fall 5.Fall
Tafel für die Verteilungsfunktion bei Normalverteilung
Fall Normalverteilung Test für den Erwartungswert Varianz bekannt
Fall Normalverteilung Test für den Erwartungswert Varianz unbekannt
Vergleich zweier unabhängiger Stichproben 1. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt Varianz von X = Varianz von Y Hypothese: Erwartungswert von X = Erwartungswert von Y
Mathematische Bedeutung der Chi-Quadrat-Verteilung Für n unabhängige Zufallsvariablen mit hat man:
Mathematische Bedeutung der t-Verteilung Für unabhängige Zufallsvariablen W und U mit hat man:
Vergleich zweier unabhängiger Stichproben 1. Fall Prüfgröße n: Umfang der Stichprobe 1 (Stichprobenvariable X) m: Umfang der Stichprobe 2 (Stichprobenvariable Y) Ablehnungsbereich bestimmt durch
Vergleich zweier unabhängiger Stichproben 2. Fall 2 unabhängige Stichproben mit Stichprobenvariablen X und Y Annahmen: X und Y normalverteilt n und m groß (> 30), damit Approximation der Varianzen sinnvoll Hypothese: Erwartungswert von X = Erwartungswert von Y
Vergleich zweier unabhängiger Stichproben 2. Fall Ausgangspunkt Approximation Prüfgröße Ablehnungsbereich bestimmt durch
Satz von Karl Pearson I X: Stichprobenvariable, die r > 2 verschieden Werte annehmen kann: Die Verteilung von X ist durch einen Wahrscheinlichkeitsvektor gegeben. Stichprobe vom Umfang n:
Satz von Karl Pearson II Dann hat man: Dabei ist:
1857 - 1936 Geboren in London. Er versuchte, statistische Methoden auf biologische Probleme der Ver- erbung und der Evolution anzuwenden. In 18 Veröffentlichungen mit dem Titel „Mathematical Contributions to the Theory of Evolution“ führte er die Regressions-Analyse, den Korrelationsko- effizienten und den Chi-Quadrat-Test ein.
1895 - 1980 Geboren in London als Sohn von Karl Pearson. Egon Pearson arbeitete ab 1921 im Institut seines Vaters am University College in London. Er be- suchte zunächst alle Vorlesungen seines Vaters mit dem Erfolg, dass er bald selbst hervorragende Arbei- ten auf dem Gebiet der Statistik produzierte. S. Neyman war 1925 - 26 als Stipendiat am University College. Die Zusammenarbeit mit Egon Pearson begann.
Geboren in Bendery, Moldavien. Als Jerzy Neyman sein Stipendium in London antrat, um mit Karl Pearson zusammenzuarbeiten, war er enttäuscht als er feststellte, dass Karl Pearson die moderne Mathematik ignorierte. Er kooperierte dann mit Egon Pearson und revolutionierte durch seine Ergebnisse die Statistik.
1876 - 1937 William Gosset, der unter dem Namen Student ver- öffentlichte, entdeckte die Gestalt der t-Verteilung (Student-Verteilung) durch eine Kombination mathe- matischer und empirischer Methoden. Er war Chemiker in der Guiness-Brauerei in Dublin 1899 und erfand die t-Verteilung, um die Qualitätskontrolle durchführen zu können.
Chi-Quadrat-Test auf Anpassung Hypothese Ablehnungsbereich
Fairer Würfel? Hypothese verwerfen!
Chi-Quadrat-Verteilung falsch 0.831
Bakterielle Infektion durch Stämme I, II, III (siehe: Gelbrich) Vermutung Typ I II III Prozentsatz 30 50 20 Konkrete Stichprobe (80 Infektionen) I II III Typ Anzahl 30 32 18
Chi-Quadrat-Verteilung falsch 0.831
Mendelsche Gesetze Prozentsätze nach der Theorie rund und gelb runzelig und gelb rund und grün runzelig und grün 0.5625 0.1875 0.1875 0.0625 Beobachtete Häufigkeiten rund und gelb runzelig und gelb rund und grün runzelig und grün 271 88 93 28 480 Summe
Chi-Quadrat-Verteilung falsch 0.831
Krankmeldungen Wochentag Mo Di Mi Do Fr n Anzahl Krankmeldungen 44 28 24 20 34 150
Chi-Quadrat-Verteilung falsch 0.831