760 likes | 961 Views
STATISIK. LV Nr.: 0028 SS 2005 1. Juni 2005. Test für arithmetisches Mittel. Zweistichprobentest für die Differenz zweier arithmetischer Mittel Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?.
E N D
STATISIK LV Nr.: 0028 SS 2005 1. Juni 2005
Test für arithmetisches Mittel • Zweistichprobentest für die Differenz zweier arithmetischer Mittel • Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? • Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?
Test für arithmetisches Mittel • Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. • Voraussetzung: • Stichproben unabhängig • Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig • Endlichkeitskorrektur ist vernachlässigbar
Test für arithmetisches Mittel • Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. • Varianzen verschieden, σ1² σ2²: • Teststatistik: • Testverteilung: Z asymptotisch N(0,1)-vt.
Test für arithmetisches Mittel • Varianzhomogenität, σ1² =σ2² = σ²: • Teststatistik: wobei • Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden
Test für arithmetisches Mittel • Verbundene Stichproben (abhängige oder gepaarte Stpr.) • Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. • Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.
Test für arithmetisches Mittel • Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD² • Teststatistik: • Testverteilung: T~tv mit v=n-1
Test für Varianz • Einstichprobentest für die Varianz: • Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? • Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. • Zweistichprobentest für die Varianz • Unterscheiden sich die Varianzen zweier Gruppen? • Entscheidung basiert auf zwei Stichproben
Test für Varianz Einstichprobentest für die Varianz: • Annahme: Grundgesamtheit normalverteilt • H0: σ² = σ0² gegen H1: σ² σ0² • Teststatistik: • Testverteilung: χ²v mit v=n-1 • Entscheidung: • χ² > χ²co oder χ² < χ²cu, lehnen H0 ab • p-Wert < α, lehne H0 ab
Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: • Annahme: Grundgesamtheit normalverteilt • H0: σ1² = σ2² gegen H1: σ1² σ2² • Teststatistik: • Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1 • Entscheidung: • F > Fco oder F < Fcu, lehnen H0 ab • p-Wert < α, lehne H0 ab
Nichtparametrische Tests • Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). • Rangtests für Lageparameter • Zeichentest • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung • Verteilungsfreie Lokationsvergleiche • Wilcoxon Rangsummentest oder Mann-Whitney U Test
Rangtests für Lagemarameter Zeichentest (Ordinalskala ausreichend) • Annahme: unabhängige Beobachtungen x1, ..., xn stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F. • Test für den Median ξ0,5 der Grundgesamtheit • Einseitige Hypothesen: • H0: ξ0,5 ξ0 gegen H1: ξ0,5 > ξ0 • H0: ξ0,5 ξ0 gegen H1: ξ0,5 < ξ0 • Zweiseitige Hypothese: • H0: ξ0,5 = ξ0 gegen H1: ξ0,5 ξ0
Rangtests für Lagemarameter • Vorgehensweise: • Transformation der Beobachtungswerte: • xi‘ = xi - ξ0 • Bestimmung von yi • yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0
Rangtests für Lagemarameter • Teststatistik: Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1): • Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung
Rangtests für Lagemarameter • Beispiel für Zeichentest (Hartung, S. 243): • Alter von Frauen bei der Geburt des ersten Kindes. H0: ξ0,5 25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.
Rangtests für Lagemarameter • Beispiel • Approximation durch N-Vt • Entscheidung (bei α=0,05): Z < 1,645 Lehne H0: ξ0,5 25 nicht ab.
Rangtests für Lagemarameter • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit • Basiert auf Rangzahlen der Beobachtungen • Annahme: n unabhängige Beobachtungen (x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F • Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
Rangtests für Lagemarameter • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit • Einseitige Hypothesen: • H0: F symmetrisch um ξ ξ0 • H0: F symmetrisch um ξ ξ0 • Zweiseitige Hypothese: • H0: F symmetrisch um ξ= ξ0
Rangtests für Lagemarameter • Vorgehensweise: • Transformation der Beobachtungswerte: • xi‘ = xi - ξ0 • Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert). • Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i
Rangtests für Lagemarameter • Teststatistik: mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0 • Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)
Rangtests für Lagemarameter • Approximation durch N(0,1) Verteilung: • Teststatistik T* (keine Bindungen): mit E T+ = n(n+1) / 4 und Var T+ = n(n+1)(2n+1) / 24 (Beim Auftreten von Bindungen: T* laut Hartung, S. 246) • Vergleich von T* mit kritischen Werten der N(0,1) Verteilung
Rangtests für Lagemarameter • Beispiel Wilcoxon Vorzeichenrangtest Psychologischer Test, Bewertung durch Punkte xi H0: F symmetrisch um ξ= ξ0 = 61, α = 0,05 • Teststatistik: ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
Rangtests für Lagemarameter • Beispiel: • T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53
Rangtests für Lagemarameter • Beispiel: • Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54 • Entscheidung: w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975 Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.
Vt.-freie Lokationsvergleiche • Wilcoxon Rangsummentest oder Mann-Whitney U Test • Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht). • Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?
Vt.-freie Lokationsvergleiche • Einseitige Hypothesen: • H0: F1(x) F2(x) gegen H1: F1(x) F2(x) und für mind. ein x gilt: F1(x) < F2(x) • H0: F1(x) F2(x) gegen H1: F1(x) F2(x)und für mind. ein x gilt: F1(x) > F2(x) • Zweiseitig Hypothese: • H0: F1(x) = F2(x) gegen H1: F1(x) F2(x)
Vt.-freie Lokationsvergleiche • Vorgehensweise: • Gemeinsame Rangzahlen der beiden Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2 • Teststatistik: • Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)
Vt.-freie Lokationsvergleiche • Entscheidung: • H0: F1(x) F2(x), H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α • H0: F1(x) F2(x), H0 verwerfen falls Wn1,n2 < Wn1;n2;α • Zweiseitig Hypothese: • H0: F1(x) = F2(x) H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2
Vt.-freie Lokationsvergleiche • Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?
Vt.-freie Lokationsvergleiche • Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05. • Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220. • Kritischer Wert: wn1;n2;0,95 = 191 • Entscheidung: 220 > 191 => H0 ablehnen. D.h. die Behandlung führt zu einem signifikant höheren Gewicht.
Varianzanalyse Varianzanalyse od. ANOVA • Frage: Hat ein Faktor Einfluss auf ein Merkmal? • Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen • Merkmal (durch Faktor beeinflusst): Metrische Größe
Varianzanalyse Varianzanalyse • Einfache Varianzanalyse: Ein Faktor • Zweifache Varianzanalyse: Zwei Faktoren • …
Varianzanalyse • Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. • Test, ob die Differenz der arithmetischen Mittel von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.
Varianzanalyse • Modellannahmen der Varinazanalyse: • Unabhängigkeit der Stichproben (i=1,…,r) • Normalverteilung der Merkmale mit µi und σi² • Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²
Varianzanalyse • Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ H0: µ1 = µ2 = … = µ • Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ H1: mindestens zwei µi sind ungleich
Varianzanalyse • Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)? • Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen). • Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.
Varianzanalyse • Modell der einfachen Varianzanalyse: • xij = µ + αi + eij • µ … Gesamtmittelwert • αi … Effekt auf der i-ten Ebene • eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene. eij = xij – µi = xij – (µ + αi)
Varianzanalyse • Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit?
Varianzanalyse Vorgehensweise: • Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen • Bestimmung der Abweichungen • Zerlegung der Abweichungsquadratsumme • Teststatistik und Testverteilung bestimmen • Entscheidung, Interpretation
Varianzanalyse • Gesamtmittelwert über alle Faktorstufen r • Mittelwerte der r Faktorstufen
Varianzanalyse • Beispiel: Drahtsorten
Varianzanalyse • Abweichungen: Quadratsumme der Abweichungen (Sum of Squares) • Abweichungen der Beobachtungen vom Gesamtmittelwert. • Summe der Quadratischen Abweichungen • Bezeichnungen: SST (Total), SSG (Gesamt)
Varianzanalyse • Sum of Squares: • Abweichungen der Beobachtungen der einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe. • Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität • Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).
Varianzanalyse • Sum of Squares: • Abweichungen der Mittelwerte der einzelnen Messreihen vom Gesamtmittelwert. • Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors. • Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),
Varianzanalyse • Quadratsummenzerlegung: • SST = SSB + SSW • Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.
Varianzanalyse • Idee für Test: • Vergleich der Variation zwischen den Messreihen mit der Variation innerhalb der Messreihen • Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).
Varianzanalyse • Teststatistik – Idee: • Aus den Beobachtungswerten werden zwei voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt. • Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich. • Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².
Varianzanalyse • Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz): • Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)