1 / 24

Forelesning 3 HSTAT1101

Forelesning 3 HSTAT1101. Ola Haug. Norsk Regnesentral. 01.09.2004. Husker du?. Komplementregelen: Addisjonsregelen: Spesialtilfelle: A og B disjunkte begivenheter Stokastisk uavhengighet:. Dagens temaer. Betinget sannsynlighet Oppdeling av utfallsrommet - total sannsynlighet Bayes’ lov

milagro
Download Presentation

Forelesning 3 HSTAT1101

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Forelesning 3HSTAT1101 Ola Haug Norsk Regnesentral 01.09.2004

  2. Husker du? • Komplementregelen: • Addisjonsregelen: Spesialtilfelle: A og B disjunkte begivenheter • Stokastisk uavhengighet:

  3. Dagens temaer • Betinget sannsynlighet • Oppdeling av utfallsrommet - total sannsynlighet • Bayes’ lov • Diagnostiske tester • (Kombinatorikk)

  4. Betinget sannsynlighet • Betinging: Hvordan tilleggsinformasjon påvirker sannsynligheten for en begivenhet • Betinget sannsynlighet for A gitt B skrives P(A|B) og er gitt ved formelen (definisjon) • Skjematisk:

  5. Eksempel - kreft • Kreft rammer oftere eldre mennesker enn yngre • Definer følgende begivenheter for en tilfeldig utvalgt person: • A: Personen får kreft i løpet av et år • B: Personen tilhører aldersgruppen 70-79 år • Spørsmål: Hva er sannsynligheten for at en vilkårlig person i aldersgruppen 70-79 år får kreft i løpet av et år, mao. hva er P(A|B)?

  6. Betinget sannsynlighet • Multiplikasjonsregelen: • Uavhengighet: Merk at for uavhengige begivenheter A og B så er P(A|B) = P(A), dvs. tilleggsopplysningen ”B har inntruffet” endrer ikke den ubetingede sannsynligheten. Da blir

  7. Eksempel - fargeblindhet • Hva er sannsynligheten for at en tilfeldig mann er fargeblind? • Hva er sannsynligheten for at en person som vi vet ikke er fargeblind er kvinne?

  8. Oppdeling av utfallsrommet - total sannsynlighet • Ved to disjunkte hendelser og , sier loven om total sannsynlighet at • Generelt: Hvis utfallsrommet deles inn i n disjunktehendelser B1,B2,…,Bn gjelder at • Spesielt (n=3):

  9. Eksempel - doping • Vi har tre (disjunkte!) kategorier av idrettsutøvere: • De som doper seg nå (2%) • De som har dopet seg tidligere (14%) • De som aldri har dopet seg (84%) • Spørsmål: Hva er sannsynligheten for at en tilfeldig dopingtest skal være positiv?

  10. Bayes’ lov • Fra siste del av multiplikasjonsregelen: • og uttrykket for total sannsynlighet: • kan vi nå avlede Bayes’ lov: • Bayes’ lov spiller en sentral rolle i beregning av usikkerhet i diagnostiske tester

  11. Eksempel – doping (forts.) • Spørsmål: Hva er sannsynligheten for at en idrettsutøver som avlegger positiv dopingtest, virkelig er dopet?

  12. Diagnostiske tester • Bakgrunn: Diagnostiske tester (HIV-test, graviditetstest, røntgen, ...) er beheftet med usikkerhet • Falske positive (indikerer sykdom hos frisk person) • Falske negative (fanger ikke opp sykdom hos syk person) • Ex. HIV-test: Oppdager antistoffer mot HIV • Positiv test: det er antistoffer i prøvematerialet • Negativ test: det er ikke antistoffer i prøvematerialet • Falsk positiv: det er antistoffer i prøven mot et beslektet virus • Falsk negativ: antistoffer mot HIV er ennå ikke dannet

  13. Diagnostiske tester • Viktige begreper I • Sensitivitet: Sannsynligheten for at en test slår ut positivt, gitt at personen er syk (evne til å avdekke sykdom hos syke). P(+ test | virkelig syk) Ex. HIV-test: 98.0% Mammografi 98.0% • Spesifisitet: Sannsynligheten for at en test slår ut negativt, gitt at personen er frisk (evne til å utelukke sykdom hos friske). P(- test | frisk) Ex. HIV-test: 99.8% Mammografi 95.0%

  14. Diagnostiske tester • Viktige begreper II • Positiv prediktiv verdi: Sannsynligheten for at en person med positiv test virkelig er syk P(syk | + test) • Negativ prediktiv verdi: Sannsynligheten for at en person med negativ test faktisk er frisk P(frisk | - test)

  15. Eksempel – positiv prediktiv verdi • Spørsmål: Hva er sannsynligheten for at en person med positiv HIV-test virkelig er HIV-smittet (positiv prediktiv verdi)?

  16. Diagnostiske tester • Avhengighet av prevalens • Positiv prediktiv verdi (PPV) kan være veldig avhengig av prevalensen. Tabellen nedenfor viser hvordan PPV fra eksempelet med HIV-testen endrer seg med prevalensen: • OBS! For sjeldne sykdommer/tilstander gir dette et problem ved masseundersøkelser: De fleste av personene med positiv prøve kan faktisk være friske!

  17. Kombinatorikk • Læresetninger som tallfester mulige utfall i et eksperiment (nyttig ved bruk av gunstige/mulige-metoden på store utvalg) • Modell: Trekker s kuler fra en urne med n (nummererte/merkede) kuler og teller opp antall mulige utfall av en slik trekning • Ulike måter å trekke på: • Med eller uten tilbakelegging • Ulike måter å organisere de uttrukne kulene på • Ordnede eller ikke-ordnede utvalg

  18. Kombinatorikk • Trekking med tilbakelegging • Etter at en kule er trukket ut, legges den tilbake i urnen igjen og har dermed samme sjanse som de øvrige kulene til å bli trukket ut på nytt. Merk at her kan s > n. • Trekking uten tilbakelegging • Uttrukne kuler legges ikke tilbake i urnen. Enhver kule kan dermed trekkes ut kun én gang.

  19. Kombinatorikk • Ikke-ordnede utvalg • Betrakter kun de s kulene i det uttrukne utvalget og tar ikke hensyn til rekkefølgen de trekkes i • Ordnede utvalg • Skiller mellom utvalg som inneholder de samme s kulene, men hvor kulene er trukket ut i forskjellig rekkefølge

  20. Kombinatorikk • Læresetninger: • Antall ordnede utvalg når s kuler trekkes blant n kuler med tilbakelegging: • Antall ikke-ordnede utvalg når s kuler trekkes blant n kuler uten tilbakelegging: leses ”n over s” og kalles binomialkoeffisienten

  21. Eksempel - Lotto • Spørsmål: Hvor mange forskjellige lottorekker fins det? • I Lotto trekkes s=7 kuler(!) ut fra totalt n=34. Trekkingen skjer uten tilbakelegging. • Rekkefølgen kulene trekkes ut i er uten betydning, dvs. vi kan se på et ikke-ordnet utvalg. • Antall mulige utvalg (=rekker) er da

  22. Eksempel - tipperekker • Spørsmål: Hva er antall mulige rekker man kan føre opp på en tippekupong? • En tipperekke kan tenkes å ha fremkommet ved at n=3 kuler merket ”H”, ”U” og ”B” trekkes s=12 ganger, dvs. vi trekker med tilbakelegging • Kamprekkefølgen tas hensyn til gjennom å se på ordnede utvalg (HUU… gir en annen tipperekke enn UHU…) • Antall mulige rekker: 312 = 531 441

  23. Eksempel – tilfeldig utvalg • En gruppe studenter består av 5 gutter og 6 jenter • Trekker et utvalg på 4 personer tilfeldig fra gruppen • Spørsmål: Hva er sannsynligheten for at utvalget blir sammensatt av kun jenter?

  24. Kommentar • Utfordring: • Vi har et sett av regneregler for sannsynligheten av hendelser, men utfordringen er ofte å spesifisere ”hensiktsmessige” hendelser slik at vi kan anvende formelverket • Tips • Prøv å bryte informasjonen som er gitt ned i hendelser med kjent sannsynlighet. Bygg deretter opp mer komplekse sannsynligheter ut fra disse + regnereglene

More Related