240 likes | 519 Views
Forelesning 3 HSTAT1101. Ola Haug. Norsk Regnesentral. 01.09.2004. Husker du?. Komplementregelen: Addisjonsregelen: Spesialtilfelle: A og B disjunkte begivenheter Stokastisk uavhengighet:. Dagens temaer. Betinget sannsynlighet Oppdeling av utfallsrommet - total sannsynlighet Bayes’ lov
E N D
Forelesning 3HSTAT1101 Ola Haug Norsk Regnesentral 01.09.2004
Husker du? • Komplementregelen: • Addisjonsregelen: Spesialtilfelle: A og B disjunkte begivenheter • Stokastisk uavhengighet:
Dagens temaer • Betinget sannsynlighet • Oppdeling av utfallsrommet - total sannsynlighet • Bayes’ lov • Diagnostiske tester • (Kombinatorikk)
Betinget sannsynlighet • Betinging: Hvordan tilleggsinformasjon påvirker sannsynligheten for en begivenhet • Betinget sannsynlighet for A gitt B skrives P(A|B) og er gitt ved formelen (definisjon) • Skjematisk:
Eksempel - kreft • Kreft rammer oftere eldre mennesker enn yngre • Definer følgende begivenheter for en tilfeldig utvalgt person: • A: Personen får kreft i løpet av et år • B: Personen tilhører aldersgruppen 70-79 år • Spørsmål: Hva er sannsynligheten for at en vilkårlig person i aldersgruppen 70-79 år får kreft i løpet av et år, mao. hva er P(A|B)?
Betinget sannsynlighet • Multiplikasjonsregelen: • Uavhengighet: Merk at for uavhengige begivenheter A og B så er P(A|B) = P(A), dvs. tilleggsopplysningen ”B har inntruffet” endrer ikke den ubetingede sannsynligheten. Da blir
Eksempel - fargeblindhet • Hva er sannsynligheten for at en tilfeldig mann er fargeblind? • Hva er sannsynligheten for at en person som vi vet ikke er fargeblind er kvinne?
Oppdeling av utfallsrommet - total sannsynlighet • Ved to disjunkte hendelser og , sier loven om total sannsynlighet at • Generelt: Hvis utfallsrommet deles inn i n disjunktehendelser B1,B2,…,Bn gjelder at • Spesielt (n=3):
Eksempel - doping • Vi har tre (disjunkte!) kategorier av idrettsutøvere: • De som doper seg nå (2%) • De som har dopet seg tidligere (14%) • De som aldri har dopet seg (84%) • Spørsmål: Hva er sannsynligheten for at en tilfeldig dopingtest skal være positiv?
Bayes’ lov • Fra siste del av multiplikasjonsregelen: • og uttrykket for total sannsynlighet: • kan vi nå avlede Bayes’ lov: • Bayes’ lov spiller en sentral rolle i beregning av usikkerhet i diagnostiske tester
Eksempel – doping (forts.) • Spørsmål: Hva er sannsynligheten for at en idrettsutøver som avlegger positiv dopingtest, virkelig er dopet?
Diagnostiske tester • Bakgrunn: Diagnostiske tester (HIV-test, graviditetstest, røntgen, ...) er beheftet med usikkerhet • Falske positive (indikerer sykdom hos frisk person) • Falske negative (fanger ikke opp sykdom hos syk person) • Ex. HIV-test: Oppdager antistoffer mot HIV • Positiv test: det er antistoffer i prøvematerialet • Negativ test: det er ikke antistoffer i prøvematerialet • Falsk positiv: det er antistoffer i prøven mot et beslektet virus • Falsk negativ: antistoffer mot HIV er ennå ikke dannet
Diagnostiske tester • Viktige begreper I • Sensitivitet: Sannsynligheten for at en test slår ut positivt, gitt at personen er syk (evne til å avdekke sykdom hos syke). P(+ test | virkelig syk) Ex. HIV-test: 98.0% Mammografi 98.0% • Spesifisitet: Sannsynligheten for at en test slår ut negativt, gitt at personen er frisk (evne til å utelukke sykdom hos friske). P(- test | frisk) Ex. HIV-test: 99.8% Mammografi 95.0%
Diagnostiske tester • Viktige begreper II • Positiv prediktiv verdi: Sannsynligheten for at en person med positiv test virkelig er syk P(syk | + test) • Negativ prediktiv verdi: Sannsynligheten for at en person med negativ test faktisk er frisk P(frisk | - test)
Eksempel – positiv prediktiv verdi • Spørsmål: Hva er sannsynligheten for at en person med positiv HIV-test virkelig er HIV-smittet (positiv prediktiv verdi)?
Diagnostiske tester • Avhengighet av prevalens • Positiv prediktiv verdi (PPV) kan være veldig avhengig av prevalensen. Tabellen nedenfor viser hvordan PPV fra eksempelet med HIV-testen endrer seg med prevalensen: • OBS! For sjeldne sykdommer/tilstander gir dette et problem ved masseundersøkelser: De fleste av personene med positiv prøve kan faktisk være friske!
Kombinatorikk • Læresetninger som tallfester mulige utfall i et eksperiment (nyttig ved bruk av gunstige/mulige-metoden på store utvalg) • Modell: Trekker s kuler fra en urne med n (nummererte/merkede) kuler og teller opp antall mulige utfall av en slik trekning • Ulike måter å trekke på: • Med eller uten tilbakelegging • Ulike måter å organisere de uttrukne kulene på • Ordnede eller ikke-ordnede utvalg
Kombinatorikk • Trekking med tilbakelegging • Etter at en kule er trukket ut, legges den tilbake i urnen igjen og har dermed samme sjanse som de øvrige kulene til å bli trukket ut på nytt. Merk at her kan s > n. • Trekking uten tilbakelegging • Uttrukne kuler legges ikke tilbake i urnen. Enhver kule kan dermed trekkes ut kun én gang.
Kombinatorikk • Ikke-ordnede utvalg • Betrakter kun de s kulene i det uttrukne utvalget og tar ikke hensyn til rekkefølgen de trekkes i • Ordnede utvalg • Skiller mellom utvalg som inneholder de samme s kulene, men hvor kulene er trukket ut i forskjellig rekkefølge
Kombinatorikk • Læresetninger: • Antall ordnede utvalg når s kuler trekkes blant n kuler med tilbakelegging: • Antall ikke-ordnede utvalg når s kuler trekkes blant n kuler uten tilbakelegging: leses ”n over s” og kalles binomialkoeffisienten
Eksempel - Lotto • Spørsmål: Hvor mange forskjellige lottorekker fins det? • I Lotto trekkes s=7 kuler(!) ut fra totalt n=34. Trekkingen skjer uten tilbakelegging. • Rekkefølgen kulene trekkes ut i er uten betydning, dvs. vi kan se på et ikke-ordnet utvalg. • Antall mulige utvalg (=rekker) er da
Eksempel - tipperekker • Spørsmål: Hva er antall mulige rekker man kan føre opp på en tippekupong? • En tipperekke kan tenkes å ha fremkommet ved at n=3 kuler merket ”H”, ”U” og ”B” trekkes s=12 ganger, dvs. vi trekker med tilbakelegging • Kamprekkefølgen tas hensyn til gjennom å se på ordnede utvalg (HUU… gir en annen tipperekke enn UHU…) • Antall mulige rekker: 312 = 531 441
Eksempel – tilfeldig utvalg • En gruppe studenter består av 5 gutter og 6 jenter • Trekker et utvalg på 4 personer tilfeldig fra gruppen • Spørsmål: Hva er sannsynligheten for at utvalget blir sammensatt av kun jenter?
Kommentar • Utfordring: • Vi har et sett av regneregler for sannsynligheten av hendelser, men utfordringen er ofte å spesifisere ”hensiktsmessige” hendelser slik at vi kan anvende formelverket • Tips • Prøv å bryte informasjonen som er gitt ned i hendelser med kjent sannsynlighet. Bygg deretter opp mer komplekse sannsynligheter ut fra disse + regnereglene