1 / 28

Forelesning 4 HSTAT1101

Forelesning 4 HSTAT1101. Ola Haug. Norsk Regnesentral. 08.09.04. Husker du?. Betinget sannsynlighet Total sannsynlighet – oppdeling av utfallsrommet i disjunkte begivenheter Bayes’ lov Binomialkoeffisienten. Diagnostiske tester - presisering.

alia
Download Presentation

Forelesning 4 HSTAT1101

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Forelesning 4HSTAT1101 Ola Haug Norsk Regnesentral 08.09.04

  2. Husker du? • Betinget sannsynlighet • Total sannsynlighet – oppdeling av utfallsrommet i disjunkte begivenheter • Bayes’ lov • Binomialkoeffisienten

  3. Diagnostiske tester - presisering • Sensitivitet og spesifisitet sier noe om sannsynligheten for ulike testutslag, gitt pasientens tilstand: • P(+ test | syk) (påvise sykdom hos syke) • P(- test | frisk) (utelukke sykdom hos friske) • Positiv og negativ prediktiv verdi (PPV og NPV) angir sannsynligheter for en persons tilstand ut fra testresultatet: • PPV = P(syk | + test) (pålitelighet av pos. testutslag) • NPV = P(frisk | - test) (pålitelighet av neg. testutslag) • Alle de fire begrepene ovenfor sier noe om testens egenskaper

  4. Diagnostiske tester - presisering • Koblinger mellom begrepene via Bayes’ lov:

  5. Dagens temaer • Stokastisk forsøk – sannsynlighetsfordeling • Binomisk fordeling • Poissonprosessen • Poissonfordeling

  6. Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk forsøk: • Et eksperiment hvor utfallet ikke er kjent på forhånd • De enkelte utfall kan ha ulik sannsynlighet for å opptre Ex. - Terningkast - Responsen på en antibiotikakur • Deterministisk forsøk: • Et eksperiment hvor utfallet er gitt når inngangsdataene er spesifisert Ex. - Tidspunkt for soloppgang (for bestemt sted og dato) - Hastigheten til ei kule som slippes fra en viss høyde (Newton)

  7. Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk variabel: • Tallstørrelse knyttet til utfallet av et stokastisk forsøk • Varierer tilfeldig fra forsøk til forsøk • Deles ofte i tellevariabler og målevariabler • Angis med stor bokstav (X, Y, …) Ex. Tellevariabler: - Antall ganger ”1” opptrer i løpet av 10 terningkast - Antall pasienter som oppsøker legevakten i løpet av et døgn Ex. Målevariabler: - Hemoglobinnivå i blodet - Levealder til en kreftpasient

  8. Stokastisk forsøk – sannsynlighetsfordeling • Sannsynlighetsfordeling: • Beskriver den tilfeldige variasjonen til en stokastisk variabel • Angir sannsynligheten for de forskjellige mulige verdiene x av den stokastiske variabelen X, P(X=x) • Sannsynlighetene for de forskjellige mulige utfallene skal summere seg til 1, • Kan presenteres i tabellform eller grafisk som et histogram Ex. Terningkast: • Registrerer hvor mange ganger ”1” opptrer i løpet av 10 kast • Mulige verdier: 0, 1, 2, …, 10 • Ikke lik sannsynlighet for alle disse utfallene!

  9. Stokastisk forsøk – sannsynlighetsfordeling

  10. Stokastisk forsøk – sannsynlighetsfordeling • Forventningsverdi • Mål for tyngdepunktet (sentrum) i en sannsynlighets-fordeling • Varians og standardavvik • Mål for spredningen i en sannsynlighetsfordeling (høye verdier indikerer stor spredning)

  11. Eksempel - myntkast • Kast en mynt tre ganger, og la X være antall kron • Da kan X ta verdiene 0,1, 2 og 3 • Sannsynlighetene for disse verdiene er henholdsvis 1/8, 3/8, 3/8 og 1/8 (gunstige / mulige) • Spørsmål: Hva er forventning, varians og standardavvik til X?

  12. Stokastisk forsøk – sannsynlighetsfordeling • Regneregler for forventning og varians • For vilkårlige tall a og b gjelder: • For en sum av stokastiske variabler gjelder at

  13. Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk uavhengighet mellom variabler: • Utfallet til hver enkelt variabel blir ikke påvirket av utfallet til den andre. Matematisk: jfr. tidligere for uavhengige hendelser: Ex. Feber og sykkelfarge • For variansen til en sum av parvis stokastisk uavhengige variabler gjelder at

  14. Stokastisk forsøk – sannsynlighetsfordeling • Sammenheng mellom gjennomsnitt og forventning? • Gjennomsnittsverdien i et datasett er en ren summasjon av observasjonene og er ikke generelt koblet til noen sannsynlighetsfordeling. • Begrepet forventningsverdi er derimot knyttet opp mot en stokastisk variabel med en nærmere bestemt sannsynlighetsfordeling og trenger ikke noe datasett for å kunne beregnes (såfremt sannsynlighets-fordelingen er kjent).

  15. Binomisk forsøksrekke • Tenk deg et forsøk hvor vi ser på blodtypen til forskjellige personer og teller antall som har blodtype B • Anta uavhengighet mellom blodtypene til de enkelte personene • Dette er et eksempel på en binomisk forsøksrekke

  16. Binomisk forsøksrekke • Definisjon: En binomisk forsøksrekke bestående av n enkeltforsøk må oppfylle følgende betingelser • De enkelte forsøk må være uavhengige av hverandre • I hvert enkeltforsøk registreres det om en begivenhet A inntreffer (suksess) eller ikke (fiasko) • Sannsynligheten for A er den samme i hvert forsøk Sannsynligheten for A betegnes p.

  17. Binomisk forsøksrekke • Flere eksempler på binomiske forsøksrekker: • Terningkast • A: ”6”-er, p=1/6 • A: ”Like antall øyne”, p=1/2 • Barnefødsler • A: jente, p=1/2 • A: ryggmargsbrokk, p=0.001 • A: fødselsvekt < 2500g, p=… • Genetikk: Mor og far bærere av genet for cystisk fibrose • A: barn sykt, p=1/4

  18. Binomisk forsøksrekke • Vi sier at antall suksesser (X) i en binomisk forsøksrekke er binomisk fordelt • Formel for sannsynligheten av utfallene i den binomiske fordelingen • Forventning og varians i den binomiske fordelingen

  19. Binomisk forsøksrekke • Utledning av binomisk fordeling • Betrakter en binomisk forsøksrekke med n enkeltforsøk • Lar den stokastiske variabelen X betegne antall ganger A inntreffer • Sannsynlighetsfordelingen til X, P(X=x) = ?.

  20. Binomisk forsøksrekke

  21. Eksempel – blodtype • Anta at 8% av en befolkning har blodtype B • Spørsmål: • Hva er sannsynligheten for at man i en gruppe på 10 personer finner én person med blodtype B? • To personer? • Hvor mange personer i gruppa kan forventes å ha blodtype B?

  22. Poissonprosessen • Betrakt antall nye tilfeller av brystkreft registrert til et kreftregister i løpet av et år • Anta at: • raten av (eller sannsynligheten for) registreringer er lik gjennom hele perioden • registreringene skjer uavhengig av hverandre • ingen registreringer kan være fullstendig sammenfallende i tid • Vi har da et eksempel på en Poissonprosess

  23. Poissonprosessen tid • Poissonprosessen framkommer når vi betrakter hendelser som fordeler seg tilfeldig over et kontinuum, f.eks. • Volum Ex. Plasseringen til røde blodlegemer i en mengde blod • Tid Ex. Registrering av krefttilfeller i løpet av et år

  24. Poissonfordelingen • Antall hendelser/objekter X innenfor et område av kontinuumet sies å være Poissonfordelt • Sannsynlighetene i Poissonfordelingen er gitt ved hvor er forventet antall hendelser/objekter innenfor området (tidsperioden, volumet, …) man betrakter.

  25. Poissonfordelingen

  26. Poissonfordelingen • Poissonfordelingen som tilnærmelse til binomisk fordeling • Tommelfingerregel: En binomisk fordelt variabel er tilnærmet Poissonfordelt (med ) hvis • Dette er en ganske vanlig situasjon i medisin: liten sannsynlighet for hendelsen, men mange forsøk (=personer) • Direkte bruk av Poissonfordelingen som fordelingen til antall hendelser i en Poissonprosess kan være mer hensiktsmessig i situasjoner hvor vi ikke kjenner n og p

  27. Eksempel – ryggmargsbrokk • Vi ønsker å se på forekomster av ryggmargsbrokk hos nyfødte • Antall fødsler på Ullevål sykehus i Oslo per år er ca. n = 5000 • P(ryggmargsbrokk) = 1 / 1000 • Spørsmål: Hva er sannsynligheten for at 6 barn fødes med ryggmargsbrokk i løpet av et år?

  28. Eksempel - AIDS • Nye AIDS-tilfeller i 1991, registrerte tilfeller per uke, 47 uker: 1 1 0 1 2 1 3 0 0 0 0 0 0 2 1 2 2 1 3 0 1 0 0 0 1 1 1 1 1 0 2 1 0 2 0 2 1 6 1 0 0 1 0 2 0 0 0 • Gjennomsnittlig antall tilfeller per uke (fra dataene): 0.936 • Spørsmål: Hva er sannsynligheten for 0 nye AIDS-tilfeller i løpet av en uke?

More Related