650 likes | 849 Views
STATISIK. LV Nr.: 0028 SS 2005 25. Mai 2005. Poissonverteilung. Verteilung seltener Ereignisse Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein Wahrscheinlichkeitsfunktion:. Poissonverteilung. Erwartungswert: E(X) = μ Varianz: Var(X) = μ
E N D
STATISIK LV Nr.: 0028 SS 2005 25. Mai 2005
Poissonverteilung • Verteilung seltener Ereignisse • Große Zahl von Versuchen n, Wahrscheinlichkeit θ für Auftreten eines Ereignisses sehr klein • Wahrscheinlichkeitsfunktion:
Poissonverteilung • Erwartungswert: E(X) = μ • Varianz: Var(X) = μ • Approximation der Binomialverteilung durch die Poissonverteilung: • n groß und θ klein, Parameter μ = n·θ • Faustregel: n > 10 und θ < 0,05. • Approximation der Hypergeometrischen Vt. • M/N = θ klein, N im Vergleich zu n groß, Parameter μ = n · M/N • Faustregel: M/N < 0,05 und n/N < 0,05
Poissonverteilung • Bsp. Wahrscheinlichkeit bei einer Prüfung von n=2000 Buchungen genau 3 (=x) Fehlbuchungen zu finden, Anteil der Fehlbuchungen: θ=0,001. • Poissonverteilung: μ = n·θ = 2
Gleichverteilung • Diskrete Zufallsvariable: • Jede der k möglichen Ausprägungen hat gleiche Wahrscheinlichkeit P(X=xi) = 1/k (i=1,…,k) • Bsp. Wahrscheinlichkeitsverteilung der Augenzahl eines idealen Würfels: P(X=xi) = 1/6 (i=1,…,6)
Gleichverteilung • Stetige Zufallsvariable: • Realisationen der stetigen Zufallsvariablen X liegen im Intervall [a;b] • Dichtefunktion: • P(x X x+Δx) = 1/(b-a) ·Δx
Gleichverteilung • Verteilungsfunktion (Integration der Dichte)
Gleichverteilung • Erwartungswert: E(X) = (a+b)/2 • Varianz: Var(X) = (b-a)² / 12 • Bsp. Wegzeit ist gleichverteilt im Intervall [30;40]. Ges. Wahrscheinlichkeit zw. 32 und 35 Min. zu benötigen. P(32 X 35) = 1/(b-a) ·Δx = 1/(40-30) · (35-32) = 0,3 Durchschnittlich benötigte Zeit: E(X) = 35
Normalverteilung • Wichtigste theoretische Verteilung: • Normalverteilung: • stetige Verteilung • symmetrische Dichtefunktion • S-förmige Verteilungsfunktion • Erwartungswert: E(X) = µ • Varianz: Var(X) = σ² • Maximum der Dichte bei x=µ • Wendepunkte bei x=µσ
Normalverteilungen • Normalverteilung: • Dichtefunktion (für -∞<x<+∞ und σ>0) : • Verteilungsfunktion:
Normalverteilung • Normalverteilungen mit unterschiedlichen Parametern
Normalverteilung • Verteilungsfunktion
Normalverteilung • Standardnormalverteilung: • Erwartungswert µ = 0 • Varianz σ² = 1 • Dichtefunktion:
Normalverteilung • Standardnormalverteilung
Normalverteilung • Approximation durch Normalverteilung: Mit wachsendem n nähern sich viele theoretische Vt. der Normalverteilung • Empirische Verteilungen lassen sich ebenfalls oft durch die N-Vt. annähern.
Normalverteilung • Reproduktionseigenschaft (od. Additivitäts- eigenschaft) der Normal-Vt. • Additionstheorem der Normalverteilung: • Die Summe (X) von n unabhängig normalverteilten Zufallvariablen X1,…,Xn ist ebenfalls normalverteilt. X = X1 + … + Xn • Der Erwartungswert von X ist die Summe der einzelnen Erwartungswerte μ1,…,μn E(X) = μ=μ1 + … + μn • Die Varianz von X ist die Summe der einzelnen Varianzen σ1²,…σn² Var(X) = σ² = σ1²+ … + σn²
Stichproben • Arithmetische Mittel der Stichprobe: • Varianz der Stichprobe: • Anteilswert P einer Stichprobe:
Stichprobenverteilung • Verteilung des arithmetischen Mittels der Stichprobe (Zufallsstichprobe): • Zufallsvariable X1,…,Xn • Konkrete Realisation: x1,…,xn • Arithmetische Mittel: • Arithm. Mittel von ZV ist wieder eine ZV (Funktion von n ZV)
Stichprobenverteilung • Erwartungswert der Verteilung des arithmetischen Mittels: • Varianz der Verteilung des arithm. Mittels • Standardabweichung od. Standardfehler
Stichprobenverteilung • Erwartungswert u. Varianz bekannt • Verteilung des arithm. Mittels? • Annahme: Grundgesamtheit ist N(μ,σ²)-vt. • Reproduktionseigenschaft der N-Vt: Summe von n unabhängig normal-vt. ZV ist wieder n-vt • Daher ist auch das arithm. Mittel normalverteilt
Grenzwertsätze Verhalten des Mittelwert von n unabhängig identisch verteilten (i.i.d.) ZV X1,…,Xn, wenn n laufend erhöht wird (n→∞) • Gesetz der Großen Zahlen • Satz von Glivenko-Cantelli • Zentraler Grenzwertsatz
Grenzwertsätze • Gesetz der Großen Zahlen: • Beinhaltet die Aussage, dass sich der Mittelwert mit wachsendem n immer mehr um den gemeinsamen Erwartungswert µ der Xi konzentriert.
Grenzwertsätze • Gesetz der Großen Zahlen: • Beinhaltet die Aussage, dass der Wert der empirischen Verteilungsfunktion an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X konvergiert.
Grenzwertsätze • Satz von Glivenko-Cantelli: • Wert der empirischen Verteilungsfunktion konvergiert an der Stelle t mit wachsendem n gegen den entsprechenden Wert der Verteilungsfunktion von X.
Grenzwertsätze • Zentraler Grenzwertsatz: • Aussage über die Form der Verteilung des Mittelwertes (standardisierte ZV Zn). Die Verteilungsfunktion von Zn konvergiert gegen die Standardnormalverteilung (Φ … Vt-Fkt. der N(0,1) Vt.)
Grenzwertsätze • Aus dem Zentralen Grenzwertsatz folgt: Die Verteilung des arithm. Mittels von n unabhängig identisch verteilten Zufallsvariablen Xi (X1,…,Xn) strebt mit wachsendem Stichprobenumfang n gegen eine Normalverteilung mit dem Erwartungswert µ und Varianz σ²/n. • Gleichbedeutend: Das arithmetische Mittel ist „asymptotisch normalverteilt“. • Faustregel: n > 30, N-Vt. ist gute Näherung für die Vt. des arithmetischen Mittels der Stichprobe.
Stichprobenverteilung • Verteilung der Varianz S² der Stichprobe: • Annahme: Grundgesamtheit ist N(µ,σ²)-vt. Xi sind n unabhängige normal-vt. ZV mit E(Xi)=µ und Var(Xi)= σ² (i=1,…,n) • Stichprobenvarianz S² ist eine Funktion von n ZV Xi und somit wieder eine ZV.
Stichprobenverteilung • Verteilung der Varianz S² der Stichprobe: • Chi-Quadrat Verteilung mit v=n-1 Freiheitsgraden, χ²n-1 • Es gilt: • Ist Z² = Xi² + … + Xn² (Summe von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi), dann folgt Z² einer Chi-Quadrat Verteilung mit v Freiheitsgraden. Anzahl der unabhängigen ZV, die Z² bilden, nennt man Anzahl der Freiheitsgrade.
Stichprobenverteilung • χ²v Verteilung: • Erwartungswert: E(Z²)=v • Varianz: Var(Z²)=2v • Mit wachsendem v nähert sich die χ²v Vt. einer N-Vt. mit Parametern µ=v und σ²=2v.
Stichprobenverteilung • Anteilswert P einer Stichprobe (P=X/n) • 2 Modelle: • Ziehen mit Zurücklegen • Ziehen ohne Zurücklegen • Bsp. Urne, N Kugeln, M schwarz, (N-M) weiße, ziehe n Kugeln (mit bzw. ohne Zurücklegen der gezogenen Kugeln), θ ist die Wahrscheinlichkeit für das Ziehen einer schwarzen Kugel.
Stichprobenverteilung • Ziehen mit Zurücklegen • Exakte Verteilung: Binomialverteilung Wahrscheinlichkeitsfunktion der ZV X: • Erwartungswert: E(X) = nθ • Varianz: Var(X) = nθ(1- θ)
Stichprobenverteilung • Ziehen mit Zurücklegen • Erwartungswert des Stichprobenanteilswertes P: E(P) = 1/n E(x) = θ • Varianz des Stichprobenanteilswertes P: Var(P) = 1/n² Var(X) = θ(1- θ) / n • Standardfehler des Anteilswertes:
Stichprobenverteilung • Approximation durch Normalverteilung (Faustregel: nθ(1- θ) ≥ 9) • Erwartungswert: E(P) = µ = nθ • Varianz: Var(P) = σP² = nθ(1- θ)
Stichprobenverteilung • Ziehen ohne Zurücklegen • Exakte Verteilung: Hypergeometrische Vt. • Wahrscheinlichkeitsfunktion der ZV X: • Erwartungswert: E(X) = n M/N • Varianz: Var(X) = nθ(1- θ) · (N-n)/(N-1)
Stichprobenverteilung • Ziehen ohne Zurücklegen: • Erwartungswert des Stichprobenanteilswertes: E(P) = 1/n E(X) = θ • Varianz des Stichprobenanteilswertes: Var(P) = 1/n² Var(X) = θ(1- θ)/n · (N-n)/(N-1) • Standardfehler des Anteilswertes: • Endlichkeitskorrektur = 1 setzen, wenn n bzgl. N sehr klein ist (Faustregel: n/N < 0,05)
Stichprobenverteilung • Approximation durch Normalverteilung µ = E(P) = θ σ² = Var(P) = θ(1- θ)/n · (N-n)/(N-1)
Stichprobenverteilung • Die Stichprobenverteilungen des arithmetischen Mittels, der Varianz und des Anteilswertes können also durch die Normalverteilung approximiert werden.
Stichprobenverteilung • Differenz zweier arithmetischer Mittel: • Annahmen: • 2 unabhängige Stichproben • Beide Grundgesamtheiten sind annähernd N-vt • Stichprobenverteilung der Differenz: N-Vt • Erwartungswert: • Varianz:
Stichprobenverteilung • Differenz zweier Anteilswerte: • Annahmen: • 2 unabhängige Stichproben • P1,P2 annähernd n-vt. und N1, N2 so groß, dass Endlichkeitskorrektur vernachlässigbar ist. • Stichprobenverteilung: N-Vt • Erwartungswert: • Varianz:
Stichprobenverteilung • Quotient zweier Varianzen: • Annahmen: • 2 unabhängige Stichproben (n1, n2) • σ1² und σ2² aus n-vt Grundgesamtheiten • Quotient:
Stichprobenverteilung • Stichprobenverteilung: F-Verteilung mit v1 und v2 Freiheitsgraden, Fv1,v2. Für v2 > 2 gilt: • Erwartungswert: E(F) = v2 / (v2-2) • Varianz:
Schätzverfahren • Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss) • Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss) • Unterscheidung: • Punktschätzer (einziger Schätzwert) • Intervallschätzer (Konfidenzintervall)
Schätzverfahren • Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. • Bsp. Schätze das unbekannte arithm. Mittel einer Grundgesamtheit μdurch das arithm. Mittel der Stichprobe • Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.
Schätzverfahren • Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall). • Irrtumswahrscheinlichkeit ≤α • Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)
Schätzverfahren • Ges: Konfidenzintervall für das arithm. Mittel: ZV • Symmetrische Wahrscheinlichkeitsintervall • Symmetrie: z(α /2) = –z(1-α/2) daher: z = –z(1-α/2) und –z = z(α /2) und
Schätzverfahren • In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α. • Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. • Varianz σ² der Grundgesamtheit bekannt • Varianz σ² der Grundgesamtheit unbekannt
Schätzverfahren • Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit: Konkreter Stichprobenmittelwert
Schätzverfahren • Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit: • Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet. • Zufallsvariable: T ist t- verteilt mit v=n-1 Freiheitsgraden