1 / 35

Statistik Lektion 2

Statistik Lektion 2. Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen. S. A. B. A ∩ B. 1, 2. 3. 4, 5. 6. Repetition. Udfaldsrum S Hændelse A ⊆ S Simpel hændelse O i Regler: 0 ≤ P(A) ≤ 1

Download Presentation

Statistik Lektion 2

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. StatistikLektion 2 Betinget sandsynlighed Bayes’ regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

  2. S A B A ∩ B 1, 2 3 4, 5 6 Repetition • Udfaldsrum S • Hændelse A⊆ S • Simpel hændelse Oi • Regler: • 0 ≤ P(A) ≤ 1 • P(A) = Σ P(Oi) • P(S) = 1 • Regler: • P(∅) = 0 • P(A⋃B) = P(A) + P(B) - P(A⋂B) • P(A) = 1 - P(A)

  3. Lov om Total Sandsynlighed • Lov om total sandsynlighed: • Vha. B kan vi opdele A i to disjunkte dele. _ B B A

  4. Lov om total sandsynlighed S E4 E3 E5 E1 , … , Ek er en disjunkte og udtømmende hændelser i S E1 A E6 E2 Lov om total sandsynlighed: lecture 1

  5. Betinget sandsynlighed Definition: Den betingede sandsynlighed P(A|B) er sandsynligheden for hændelsen A, givet at vi ved at hændelsen B allerede er indtruffet: Det gælder også når vi ombytter A og B

  6. Betinget sandsynlighed - intuition • Antag alle udfald er lige sandsynlige, dvs. • N = antal udfald i udfalds rum • NA = antal udfald i hændelse A • Hvad er sandsynligheden for A givet at B er indtruffet? ∙ S ∙ ∙ A B ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙

  7. Betinget sandsynlighed - Eksempel Eksempel: Køns-fordeling af arbejdsløse/ikke-arbejdsløse med studentereksamen i en lille by

  8. Multiplikationsregel • Betinget sandsynlighed Af betingede sandsynlighed følger multiplikationsreglen : • Eksempel: Konsulent på jagt efter job A og job B. Sandsynligheden for at få job A er P(A) = 0.45. Givet at han får job A er sandsynligheden for at få job B P(B|A) = 0.9. • Spørgsmål: Hvad er sandsynligheden for at konsulent får både job A og job B? • Svar:

  9. Uafhængighed Definition: To hændelser A og B er statistisk uafhængige, hvis og kun hvis • Konsekvenser: Hvis A og B er statistisk uafhængige hændelser • Fortolkning af P(B|A) = P(B): Selvom vi ved at A er indtruffet, ændrer det ikke på sandsynligheden for B.

  10. Tjek for uafhængighed Eksempel: Spørgsmål: Er hændelserne ”Mand” og ”I arbejde” uafhængige? Dvs. de to hændelser “Mand” og “I arbejde” er afhængige

  11. Bayes’ sætning Defintion: Hvis A og B er hændelser, da siger Bayes’ sætning: under antagelse af P(A)>0. Sætningen følger umiddelbart af at kombinere betinget sandsynlighed med multiplikationsreglen og lov om total sandsynlighed.

  12. Bayes’ sætning (udvidet) Defintion: Hvis E1, E2, …, EK er disjunkte og udtømmende hændelser i S, så siger Bayes’ sætning under antagelse af P(A)>0.

  13. Bayes’ sætning: Test for sjælden sygdom • En test for en sjælden sygdom, der rammer 0,1% af befolkningen (P( I )=0,001), er upræcis. Lad i det følgende: • Sandsynligheden for at testen er positiv når man er syg: • Sandsynligheden for at testen er positiv, når man er rask: • Hvad er så sandsynligheden for at man er syg, givet at testen var positiv?

  14. Stokastisk variabel I et eksperiment kan man ofte knytte en talværdi til hvert udfald S s X(s) R Definition: En stokastisk variabelX er en funktion defineret på S, der antager værdier på den reelle akse X: S  R Mulige udfald Reelle tal lektion 2

  15. Stokastiske variable Eksempler: Stokastisk variable Type Antallet af øjne ved kast med en terning diskret Summen ved kast af to terninger diskret Antallet af børn i en familie diskret Alder af en førstegangsfødende kvinde diskret Tid det tager at løbe fem km kontinuert Mængde af sukker i en sodavand kontinuert Højde af mænd kontinuert tælle måle Diskret: antager et endeligt antal værdier eller et uendeligt men tælleligt antal værdier. Kontinuert: antager værdier i en mængde af reelle tal. lektion 2

  16. Sandsynlighedsfunktion • Definition: • Lad X : S  Rvære en diskretstokastiskvariabel. • FunktionenP(x)er en sandsynlighedsfunktionfor X, hvis • 1. P(x)  0 for alle x • 2. • 3. P(X = x) = P(x), • hvorP(X = x)ersandsynligheden for de udfaldsS: X(s) = x. lektion 2

  17. Sandsynlighedsfunktion: Eksempel Lad den stokastiske variabel X være antallet af solgte sandwich i løbet af en time. Sandsynlighedsfunktionen der hører til X er x P(x) 0 0.1 1 0.2 2 0.4 3 0.3 1.0

  18. Kumulativ fordelingsfunktion Definition: Den kumulative fordelingsfunktion, F(x), for en diskret stokastisk variabel X er: Kumulative fordelingsfunktions for antallet af solgte sandwich: x P(x) F(x) 0 0.1 0.1 1 0.2 0.3 2 0.4 0.7 3 0.3 1.0 1.0 0.4

  19. Eksempel - fortsat • x P(x) F(x) • 0 0.1 0.1 • 0.2 0.3 • 0.4 0.7 • 3 0.3 1.0 • 1.0

  20. Middelværdi Definition: Antag X er en diskret stokastisk variabel med sandsynlighedsfunktion P(x). Da erMiddelværdien for X er givet ved: • Dvs. summen af hver mulig værdi af X ganget med den tilsvarende sandsynlighed – et vægtet gennemsnit. • Bemærk! Middelværdien for en stokastisk variabel kaldes også den forventede værdi.

  21. Middelværdi - Eksempel • x P(x) xP(x) • 0 0.1 0.0 • 0.2 0.2 • 0.4 0.8 • 3 0.30.9 • 1.0 1.9 Konklusion: Dvs. middelværdien af den stokastiske variabel er 1.9 Det forventede antal solgte sandwich er 1.9…

  22. Varians for diskret stokastisk variabel Definition: Antag at X er en diskret stokastisk variabel med sandsynlighedsfunktion P(x). Da er variansen for X givet ved Ækvivalent er variansen givet ved

  23. Varians: Eksempel • x x2 P(x) xP(x) x2P(x) • 0 0 0.1 0.0 0.0 • 1 0.2 0.2 0.2 • 4 0.4 0.8 1.6 • 3 9 0.30.9 2.7 • 1.0 1.9 4.5

  24. Regneregler for middelværdi og varians • Hvis X er en diskret stokastisk variabel, da er middelværdien for en funktion h(X) givet ved • Regneregler for en lineær funktion af X: • Lad Y = aX + b. Da er Y også en stokastisk variabel.

  25. Eksempel • Håndboldspiller er på resultatkontrakt! Pr kamp får han 10000kr plus 1500kr pr mål. • Lad X være den stokastiske variabel, der svarer til antal mål scoret i èn kamp. • Det vides at E[X] = 4.6 V[X] = 5.2 • Hvad er den forventede udbetaling pr kamp? Variansen? • Løn for en kamp:Y = 10000 + 1500 X • E[B] = V[B] =

  26. Binomial fordeling Binomial-fordelingen er resultatet af et Binomialt eksperiment: • Det Binomiale eksperiment består af et fast antal (n) forsøg. • I hvert forsøg er der to mulige udfald, succes og fiasko. • P(”succes”)=p, dvs. sandsynligheden for succes er den samme i hvert forsøg. (Ligeledes for P(”fiasko”)=1-p) • Forsøgene er uafhængige • Antallet af succeser følger da en binomial fordeling

  27. Binomial fordeling - Eksempler • Kast med en mønt n gange. • S=(krone (succes), plat (fiasko)). Hvis fair mønt p=0,5. Sandsynligheden er konstant og forsøgene er uafhængige, da et møntkasts udfald ikke påvirker udfaldet af det næste kast • Træk et kort n gange. • S=(”spar (succes)”, ”andet (fiasko)”). P(spar)=0,25 er konstant, hvis vi lægger kortet tilbage i bunken igen, ellers ikke. Uafhængige. • Bemærk! Uden tilbagelægning vil P(nummer 2 spar, hvis nummer 1 er en spar)= 12/51 og dermed ikke konstant sandsynlighed

  28. Sandsynlighed for Sekvens • Vi udfører n = 5 uafhængige Bernoulli forsøg, hver med sandsynlighed p for succes. • Lad ’S’ betegne succes og ’F’ betegne fiasko. • Hvad er sandsynligheden for sekvensen af udfald • Svar: hvor x er antallet af succeser. • Bemærk: Sandsynligheden afhænger kun af antal succer - ikke hvornår i sekvenser de kommer. SSFSF Uafhængighed

  29. Sandsynlighed for 3 Succeser I 5 Forsøg • Vi har stadig n = 5 uafhængige forsøg som før. • Der er 25 = 32 mulige sekvenser af succeser og fiaskoer. • Alle sekvenser med 3 succeser FFSSS FSFSS FSSFS FSSSF SFFSS SFSF SFSSF SSFFS SSFSF SSSFF • Totalt 10 måder at får x = 3 succeser i n = 5 forsøg. • Sandsynlighed for x=3 succeser er Antal sekvenser med 3 succeser Sandsynligheden for en given sekvens med 3 succeser

  30. Antal Sekvenser • Antag vi udfører n forsøg. • Hvor mange forskellige sekvenser med x succeser findes der? • Svar: hvor [”n fakultet”] • Eksempel: n = 5 forsøg og x = 3 succeser. Binomial-koefficienten

  31. Binomial fordelingen Definition: En diskret stokastisk variable X siges at følge en binomial fordeling med antalsparameter n og sandsynlighedsparameterp, hvis sandsynlighedsfunktionen for X er givet ved Notation: X ~ B(n,p) ”X følger en binomial-fordeling med…” Egenskaber: Middelværdi: m = E[X] = np Varians: s2 = V[X] = np(1-p)

  32. Formen På Binomial-fordelingen p = 0.1 p = 0.3 p = 0.5 • Binomial-fordelingen bliver mere symmetrisk, når n øges og p→ 0.5 n = 4 n = 10 n = 20

  33. Binomialfordelingen i R Antal X ~ B(10,0.2) Vi kan udregne P(X=7) vha. kommandoen dbinom(x=7,size=10,prob=0.2) Vi kan plotte sandsynlighedsfunktionen plot(0:10, dbinom(x=0:10,size=10,prob=0.2),type="h")

  34. Binomialfordelingen i R Antal X ~ B(10,0.2) Vi kan den kumulerede sandsynlighed F(7) = P(X7) vha. kommandoen pbinom(q=7,size=10,prob=0.2) Vi kan plotte den kumulerede sandsynlighed vha. kommandoen plot(0:10, pbinom(q=0:10,size=10,prob=0.2),type="s")

  35. Binomialfordelingen i R Antal X ~ B(10,0.2) Vi kan simulere 100 realisationer af X vha. kommandoen x = rbinom(n=100,size=10,prob=0.2) Vi kan plotte resultat fx. som et histogram hist(x,breaks=seq(-0.5,7.5,by=1),freq=F) lines(0:10, dbinom(x=0:10,size=10,prob=0.2),type="h") Linjerne angiver sandsynligheds-funktionen for B(10,0.2)

More Related