260 likes | 496 Views
Statistik – Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var. Repetition. Population Populationsstørrelse N Populationsmiddelværdi μ Populationsvarians σ 2. Stikprøve Stikprøvestørrelse n Stikprøvemiddelværdi
E N D
Statistik – Lektion 2 Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.
Repetition • Population • Populationsstørrelse N • Populationsmiddelværdi μ • Populationsvarians σ2 • Stikprøve • Stikprøvestørrelse n • Stikprøvemiddelværdi • Stikprøvevarians s2 Hændelser Sandsynligheder
Simultan og marginal sandsynlighed • Simultan sandsynlighed er sandsynligheden for at en eller flere hændelser indtræffer simultant, fx P(A1∩B1) • Marginale sandsynligheder beregnes ved at summere over rækker og søjler Holdning til fælles fond B Skole B
Uafhængighed • To hændelser er uafhængige hvis: • Lige meget hvilken kombination af hændelser vi vælger, skal uafhængigheden gælde. Hvis bare en kombination viser afhængighed, er hændelserne afhængige.
Uafhængighed • Eksempel: Er der uafhængighed mellem om en fælles fond er god eller dårlig og om manageren kom fra en god eller dårlig skole? Holdning til fælles fond B Skole B • Check fx om P(B1|A1) = P(B1) el. P(A2∩B2)= P(A2)P(B2)
Lov om Total Sandsynlighed • Lov om total sandsynlighed: • I ord: Sandsynligheden for A er lig sandsynligheden for A og B plus sandsynligheden for A og B’s kompliment. _ B B A
Eksempel – Lov om Totalsandsynlighed • Kortspil – find sandsynligheden for at trække et billedkort, A: • Det må være sandsynligheden for at trække en billedkort i Hjerter (H), Spar (S), Ruder (R) eller Klør (K): • P(A)=P(A∩H) + P(A∩S) + P(A∩R) + P(A∩K) = 3/52 + 3/52 + 3/52 + 3/52 = 12/52 Spar Hjerter Ruder Klør A∩S A∩R A∩H A∩K A
Bayes’ sætning Bemærk: Vi har ”vendt” de betingede sandsynligheder!
Bayes’ sætning – Eksempel 2-10 • En test for en sjælden sygdom, der rammer 0,1% af befolkningen (P(I)=0,001), er upræcis. Lad i det følgende: • Sandsynligheden for at testen er positiv når man er syg: • Sandsynligheden for at testen er positiv, når man er rask: • Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?
Stokastisk Variabel: Et eksempel Betragt de forskellig mulige ordninger af drenge (B) og piger (G) i fire fødsler. Der er2*2*2*2=24 = 16 muligheder og udfaldsrummet er: BBBB BGBB GBBB GGBB BBBG BGBG GBBG GGBG BBGB BGGB GBGB GGGB BBGG BGGG GBGG GGGG Hvis pige og dreng er lige sandsynlige, [P(G) = P(B) = 1/2], og kønnet af hvert barn er uafhængig af kønnet på det foregående barn, så er sandsynligheden for hver af disse 16 muligheder: (1/2)(1/2)(1/2)(1/2) = 1/16.
Eksempel - fortsat • Tæl antallet af piger i hver af de fire fødsler: • BBBB (0) BGBB (1) GBBB (1) GGBB (2) • BBBG (1) BGBG (2) GBBG (2) GGBG (3) • BBGB (1) BGGB (2) GBGB (2) GGGB (3) • BBGG (2) BGGG (3) GBGG (3) GGGG (4) • Bemærk at: • hvert mulig udfald tildeles en enkelt værdi • værdierne, der tildeles varierer over de forskellige udfald • Antallet af piger er en stokastisk variabel: • En stokastisk variabel , X,er en funktion, der tildeler en enkelt, men variabel værdi til hvert element i udfaldsrummet.
BBBB BGBB GBBB BBBG BBGB GGBB GBBG BGBG BGGB GBGB BBGG BGGG GBGG GGGB GGBG GGGG 0 1 X 2 3 4 Udfalds rum Eksempel - fortsat Punkter på den reelle linie
X: S R S X oi R 0 X(oi) Stokastisk variabel • En stokastisk variabelX er en funktion defineret på S (udfaldsrummet), der antager værdier på R (reelle tal) • I eksperimenter knyttes en talværdi til hvert udfald: • Stokastiske variable kan enten være diskrete eller kontinuerte. • Diskrete: Antager et endeligt antal værdier • Kontinuerte: Antager værdier i en mængde af reelle tal
Eksempler på diskrete og kontinuerte variable Resten af denne forelæsning ser vi på diskrete stokastiske variable
Eksempel - fortsat Eksempel: Den stokastisk variabel X = 3 når de følgende fire hændelser BGGG, GBGG, GGBG, eller GGGB forekommer, P(X = 3) = P(BGGG) + P(GBGG) + P(GGBG) + P(GGGB) = 4/16 Sandsynligheds fordelingen af en stokastisk variabel er en tabel, der opskriver alle de mulige værdier af en stokastisk variabel og deres tilknyttede sandsynligheder. x P(x) For eksemplet: 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 16/16=1
Sandsynligheds fordeling Definition: Lad X:S→R være en diskret stokastisk variabel. P(X=x) = P(x) er en sandsynligheds-fordeling (-funktion) for X, hvis:
Kumulativ fordelingsfunktion Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er: Kumulative fordelingsfunktions for antallet af piger ved 4 fødsler: x P(x)F(x) 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 16/16 1.00 1 . 0 0 . 9 0 . 8 0 . 7 0 . 6 ) x ( 0 . 5 F 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 0 1 2 3 4 x
x P(x)F(x) 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 16/16 1.00 Eksempel - fortsat
Middelværdi • Middelværdien af en diskret stokastisk variabel X er givet ved: • Dvs. summen af værdien gange sandsynligheden for værdien – et vægtet gennemsnit. • Bemærk! Middelværdi kaldes også den forventede værdi.
Middelværdi - Eksempel x P(x) xP(x) 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 16/16=1 Eksempel: X er antal øjne ved terningkast. Dvs. P(X=1) = P(X=2) = … = P(X=6) =1/6. Middelværdien er da:
Varians • Variansen er den vægtede gennemsnitlige kvadrerede afvigelse af værdierne af en stokastisk variabel fra gennemsnittet. • Standard afvigelsen er kvadratroden af variansen:
Varians - eksempel x x2 P(x) x2P(x) xP(x) 0 0 1/16 0 0 1 1 4/16 4/16 4/16 2 4 6/16 24/16 12/16 3 9 4/16 36/16 12/16 4 16 1/1616/164/16 1 80/16 32/16
Chebyshevs Sætning • For en stokastisk variabel X med middelværdi μ og varians σ2 og ethvert tal k>1 gælder: • Ex: k=2: • Dvs. at med mindst 75% sandsynligheden er X mindre end to standardafvigelser fra μ.
Regneregler for middelværdi og varians Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved Regneregler for en lineær funktion af X:
Regneregler for middelværdi og varians Middelværdien af en linearkombination af stokastiske variable X1,X2,…,Xk. Hvis X1,X2,…,Xk er indbyrdes uafhængige, så: