1 / 75

STATISIK

STATISIK. LV Nr.: 0028 SS 2005 1. Juni 2005. Test für arithmetisches Mittel. Zweistichprobentest für die Differenz zweier arithmetischer Mittel Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?.

addo
Download Presentation

STATISIK

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. STATISIK LV Nr.: 0028 SS 2005 1. Juni 2005

  2. Test für arithmetisches Mittel • Zweistichprobentest für die Differenz zweier arithmetischer Mittel • Unterscheiden sich die Mittelwerte zweier Grundgesamtheiten? • Unterscheiden sich die Mittelwerte zweier verbundener Stichproben?

  3. Test für arithmetisches Mittel • Differenz zweier arithmetischer Mittel die aus 2 Grundgesamtheiten stammen. • Voraussetzung: • Stichproben unabhängig • Stichproben stammen aus einer N-vt. Grundgesamtheiten bzw. Approximation durch N-Vt. ist zulässig • Endlichkeitskorrektur ist vernachlässigbar

  4. Test für arithmetisches Mittel • Unterscheide, ob die Varianzen der beiden Grundgesamtheiten homogen sind oder nicht. • Varianzen verschieden, σ1²  σ2²: • Teststatistik: • Testverteilung: Z asymptotisch N(0,1)-vt.

  5. Test für arithmetisches Mittel • Varianzhomogenität, σ1² =σ2² = σ²: • Teststatistik: wobei • Testverteilung: T ~ tv mit v=n1+n2-2 Freiheitsgarden

  6. Test für arithmetisches Mittel • Verbundene Stichproben (abhängige oder gepaarte Stpr.) • Tritt auf, wenn z.B. die Merkmalsausprägungen der ersten Stpr. und die der zweiten jeweils an demselben Merkmalsträger erhoben werden. Bsp: vorher – nachher Untersuchungen. • Test für die Differenz arithmetischer Mittel bei verbundenen Stichproben.

  7. Test für arithmetisches Mittel • Differenzen der Wertepaare: Di = X2i – X1i sind N-vt. mit E(Di) = µ2i - µ1i = δ und Var(Di) =σD² • Teststatistik: • Testverteilung: T~tv mit v=n-1

  8. Test für Varianz • Einstichprobentest für die Varianz: • Hat die Varianz einen bestimmten Wert, bzw. liegt er in einem bestimmten Bereich? • Entscheidung basiert auf dem Ergebnis einer einzigen Stichprobe. • Zweistichprobentest für die Varianz • Unterscheiden sich die Varianzen zweier Gruppen? • Entscheidung basiert auf zwei Stichproben

  9. Test für Varianz Einstichprobentest für die Varianz: • Annahme: Grundgesamtheit normalverteilt • H0: σ² = σ0² gegen H1: σ² σ0² • Teststatistik: • Testverteilung: χ²v mit v=n-1 • Entscheidung: • χ² > χ²co oder χ² < χ²cu, lehnen H0 ab • p-Wert < α, lehne H0 ab

  10. Test für Varianz Zweistichprobentest für den Quotienen zweier Varianzen: • Annahme: Grundgesamtheit normalverteilt • H0: σ1² = σ2² gegen H1: σ1²  σ2² • Teststatistik: • Testverteilung: Fv1,v2 mit v1=n1-1 und v2=n2-1 • Entscheidung: • F > Fco oder F < Fcu, lehnen H0 ab • p-Wert < α, lehne H0 ab

  11. Nichtparametrische Tests • Nichtparametrische Tests (v.a. wenn Annahme der Normalverteilung nicht erfüllt ist). • Rangtests für Lageparameter • Zeichentest • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Verteilung • Verteilungsfreie Lokationsvergleiche • Wilcoxon Rangsummentest oder Mann-Whitney U Test

  12. Rangtests für Lagemarameter Zeichentest (Ordinalskala ausreichend) • Annahme: unabhängige Beobachtungen x1, ..., xn stammen aus einer Grundgesamtheit mit stetiger Verteilungsfunktion F. • Test für den Median ξ0,5 der Grundgesamtheit • Einseitige Hypothesen: • H0: ξ0,5  ξ0 gegen H1: ξ0,5 > ξ0 • H0: ξ0,5  ξ0 gegen H1: ξ0,5 < ξ0 • Zweiseitige Hypothese: • H0: ξ0,5 = ξ0 gegen H1: ξ0,5  ξ0

  13. Rangtests für Lagemarameter • Vorgehensweise: • Transformation der Beobachtungswerte: • xi‘ = xi - ξ0 • Bestimmung von yi • yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0, Bindungen: yi = ½ falls xi‘ = 0

  14. Rangtests für Lagemarameter • Teststatistik: Unter H0 ist T ~ B(n, ½) • Approximation durch N(0,1): • Entscheidung: Vergleich von Z mit kritischen Werten der N(0,1) Verteilung

  15. Rangtests für Lagemarameter • Beispiel für Zeichentest (Hartung, S. 243): • Alter von Frauen bei der Geburt des ersten Kindes. H0: ξ0,5  25 gegen H1: ξ0,5 > 25. Zufällige Auswahl von n = 36 Müttern.

  16. Rangtests für Lagemarameter • Beispiel • Approximation durch N-Vt • Entscheidung (bei α=0,05): Z < 1,645 Lehne H0: ξ0,5  25 nicht ab.

  17. Rangtests für Lagemarameter • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum einer Grundgesamtheit • Basiert auf Rangzahlen der Beobachtungen • Annahme: n unabhängige Beobachtungen (x1, ..., xn) stammen aus einer Grundgesamtheit mit Verteilungsfunktion F • Frage: Ist die Verteilung symmetrisch um einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?

  18. Rangtests für Lagemarameter

  19. Rangtests für Lagemarameter • Wilcoxon Vorzeichenrangtest für das Symmetriezentrum ξ0 einer Grundgesamtheit • Einseitige Hypothesen: • H0: F symmetrisch um ξ ξ0 • H0: F symmetrisch um ξ ξ0 • Zweiseitige Hypothese: • H0: F symmetrisch um ξ= ξ0

  20. Rangtests für Lagemarameter • Vorgehensweise: • Transformation der Beobachtungswerte: • xi‘ = xi - ξ0 • Ohne Berücksichtigung der Vorzeichen der xi‘ Rangzahlen Ri zuweisen (1 für kleinsten Wert, ..., n für größten Wert). • Den Rangzahlen werden die Vorzeichen der zugehörigen xi‘ Werte zugewiesen => Rangstatistik R̃i

  21. Rangtests für Lagemarameter • Teststatistik: mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0 • Entscheidung: Vergleich von T+ mit kritischen Werten wn,α des Vorzeichenrang-test von Wilcoxon (z.B. Hartung S. 245)

  22. Rangtests für Lagemarameter • Approximation durch N(0,1) Verteilung: • Teststatistik T* (keine Bindungen): mit E T+ = n(n+1) / 4 und Var T+ = n(n+1)(2n+1) / 24 (Beim Auftreten von Bindungen: T* laut Hartung, S. 246) • Vergleich von T* mit kritischen Werten der N(0,1) Verteilung

  23. Rangtests für Lagemarameter • Beispiel Wilcoxon Vorzeichenrangtest Psychologischer Test, Bewertung durch Punkte xi H0: F symmetrisch um ξ= ξ0 = 61, α = 0,05 • Teststatistik: ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0

  24. Rangtests für Lagemarameter • Beispiel: • T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1 +1·10,5+1·7 = 53

  25. Rangtests für Lagemarameter • Beispiel: • Kritische Werte aus Tabelle: wn;α/2 = w11;0,025 = 11 und wn;1-α/2 = w11;0,975 = 54 • Entscheidung: w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975 Daher: lehne H0 nicht ab, F ist symmetrisch um ξ0 = 61.

  26. Vt.-freie Lokationsvergleiche • Wilcoxon Rangsummentest oder Mann-Whitney U Test • Annahme: zwei unabhängige Messreihen, zugrundeliegenden Verteilungsfunktionen sind stetig und vergleichbar (d.h. sie schneiden einander nicht). • Frage: Besteht ein Unterschied in den Verteilungen? Sind z.B. die Werte der einen Messreihe „im Durchschnitt größer“ als die der anderen?

  27. Vt.-freie Lokationsvergleiche

  28. Vt.-freie Lokationsvergleiche • Einseitige Hypothesen: • H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x) und für mind. ein x gilt: F1(x) < F2(x) • H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x)und für mind. ein x gilt: F1(x) > F2(x) • Zweiseitig Hypothese: • H0: F1(x) = F2(x) gegen H1: F1(x)  F2(x)

  29. Vt.-freie Lokationsvergleiche • Vorgehensweise: • Gemeinsame Rangzahlen der beiden Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2 • Teststatistik: • Kritische Werte des Wilcoxon-Rangsummen-Tests aus Tabelle (siehe z.B. Hartung 518)

  30. Vt.-freie Lokationsvergleiche • Entscheidung: • H0: F1(x)  F2(x), H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α • H0: F1(x)  F2(x), H0 verwerfen falls Wn1,n2 < Wn1;n2;α • Zweiseitig Hypothese: • H0: F1(x) = F2(x) H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder Wn1,n2 > Wn1;n2;1-α/2

  31. Vt.-freie Lokationsvergleiche • Beispiel: Behandlung von Pilzen mit Vitamin B1. Führt diese Behandlung zu (signifikant) höherem Gewicht?

  32. Vt.-freie Lokationsvergleiche • Beispiel: H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch kleiner als XK, α = 0,05. • Teststatistik: Summe der Ranzahlen der ersten Messreihe (Behandlungsgruppe): Wn1,n2 = 220. • Kritischer Wert: wn1;n2;0,95 = 191 • Entscheidung: 220 > 191 => H0 ablehnen. D.h. die Behandlung führt zu einem signifikant höheren Gewicht.

  33. Varianzanalyse Varianzanalyse od. ANOVA • Frage: Hat ein Faktor Einfluss auf ein Merkmal? • Faktor: Nominal skalierte Größe, Faktorausprägungen = Ebenen oder Stufen • Merkmal (durch Faktor beeinflusst): Metrische Größe

  34. Varianzanalyse Varianzanalyse • Einfache Varianzanalyse: Ein Faktor • Zweifache Varianzanalyse: Zwei Faktoren • …

  35. Varianzanalyse • Test, für arithmetische Mittel von zwei oder mehr Grundgesamtheiten. • Test, ob die Differenz der arithmetischen Mittel von zwei oder mehr als zwei Grundgesamtheiten signifikant von Null verschieden ist.

  36. Varianzanalyse • Modellannahmen der Varinazanalyse: • Unabhängigkeit der Stichproben (i=1,…,r) • Normalverteilung der Merkmale mit µi und σi² • Varianzhomogenität (Homoskedastizität), d.h. σi² = σ²

  37. Varianzanalyse • Nullhypothese: Alle Gruppen haben den gleichen Mittelwert µ H0: µ1 = µ2 = … = µ • Alternativhypothese: Nicht alle Gruppen haben den gleichen Mittelwert µ H1: mindestens zwei µi sind ungleich

  38. Varianzanalyse • Frage: Beeinflusst der Faktor (nominal-skalierte Größe) das Merkmal (metrisch-skalierte Größe)? • Unter H0: µi = µ für alle i (i = 1,…,r Faktorstufen). • Abweichung, die dem Faktor zuzuschreiben sind: αi = µi - µ (i = 1,…,r) heißen wahre Effekte auf der i-ten Ebene.

  39. Varianzanalyse • Modell der einfachen Varianzanalyse: • xij = µ + αi + eij • µ … Gesamtmittelwert • αi … Effekt auf der i-ten Ebene • eij … Versuchsfehler = die Abweichung eines zufällig aus der i-ten Ebene des Faktors herausgegriffenen Beobachtungswertes xik vom Mittelwert µi dieser Ebene. eij = xij – µi = xij – (µ + αi)

  40. Varianzanalyse • Beispiel: Zugfestigkeit von r = 3 Drahtsorten überprüfen, je Sorte 6 Proben, unabhängig voneinander und N(µi,σ²)-vt. Frage: Bestehen signifikante Unterschiede in der Zugfestigkeit?

  41. Varianzanalyse Vorgehensweise: • Gesamtmittelwert aller Faktorstufen und Mittelwerte der Faktorstufen bestimmen • Bestimmung der Abweichungen • Zerlegung der Abweichungsquadratsumme • Teststatistik und Testverteilung bestimmen • Entscheidung, Interpretation

  42. Varianzanalyse • Gesamtmittelwert über alle Faktorstufen r • Mittelwerte der r Faktorstufen

  43. Varianzanalyse • Beispiel: Drahtsorten

  44. Varianzanalyse • Abweichungen: Quadratsumme der Abweichungen (Sum of Squares) • Abweichungen der Beobachtungen vom Gesamtmittelwert. • Summe der Quadratischen Abweichungen • Bezeichnungen: SST (Total), SSG (Gesamt)

  45. Varianzanalyse • Sum of Squares: • Abweichungen der Beobachtungen der einzelnen Messreihen vom Mittelwert der jeweiligen Messreihe. • Summe der Quadratischen Abweichungen des Restes, Maß für die nicht durch den Faktor beeinflusste Restvariabilität • Bezeichnungen: SSW (Within), SSE (Error), SSR (Residual).

  46. Varianzanalyse • Sum of Squares: • Abweichungen der Mittelwerte der einzelnen Messreihen vom Gesamtmittelwert. • Mit Stichprobengröße multiplizierte Summe der Quadratischen Abweichungen der Stichprobenmittelwerte vom Gesamtmittelwert, also der beobachteten Effekte des Faktors. • Bezeichnungen: SSB (Between), SSE (Explained), SSM (Model), SST (Treatment),

  47. Varianzanalyse • Quadratsummenzerlegung: • SST = SSB + SSW • Interpretation: Gesamtvarianz (SST) setzt sich aus der Variation zwischen den Messreihen (SSB) und der Variation innerhalb der Messreihen (SSW) zusammen.

  48. Varianzanalyse • Idee für Test: • Vergleich der Variation zwischen den Messreihen mit der Variation innerhalb der Messreihen • Ist die Variation zwischen den Messreihen größer als jene innerhalb der Messreihen, schließe auf Unterschied zwischen den Messreihen (Faktoreffekt).

  49. Varianzanalyse • Teststatistik – Idee: • Aus den Beobachtungswerten werden zwei voneinander unabhängige Schätzwerte für sW² und sB² für die Varianzen der Beobachtungswerte innerhalb und zwischen den Stichproben bestimmt. • Liegen keine wahren Effekte vor (Gültigkeit von H0), sind sW² und sB² (bis auf zufällige Abweichungen) gleich. • Bei Vorhandensein von wahren Effekten (H1) ist sB² systematisch größer als sW².

  50. Varianzanalyse • Erwartungstreuer Schätzer für die Varianz innerhalb der Messreihen (Restvarianz): • Erwartungstreuer Schätzer für die Varianz zwischen den Messreihen (Faktoreffekt)

More Related