280 likes | 581 Views
Forelesning 4 HSTAT1101. Ola Haug. Norsk Regnesentral. 08.09.04. Husker du?. Betinget sannsynlighet Total sannsynlighet – oppdeling av utfallsrommet i disjunkte begivenheter Bayes’ lov Binomialkoeffisienten. Diagnostiske tester - presisering.
E N D
Forelesning 4HSTAT1101 Ola Haug Norsk Regnesentral 08.09.04
Husker du? • Betinget sannsynlighet • Total sannsynlighet – oppdeling av utfallsrommet i disjunkte begivenheter • Bayes’ lov • Binomialkoeffisienten
Diagnostiske tester - presisering • Sensitivitet og spesifisitet sier noe om sannsynligheten for ulike testutslag, gitt pasientens tilstand: • P(+ test | syk) (påvise sykdom hos syke) • P(- test | frisk) (utelukke sykdom hos friske) • Positiv og negativ prediktiv verdi (PPV og NPV) angir sannsynligheter for en persons tilstand ut fra testresultatet: • PPV = P(syk | + test) (pålitelighet av pos. testutslag) • NPV = P(frisk | - test) (pålitelighet av neg. testutslag) • Alle de fire begrepene ovenfor sier noe om testens egenskaper
Diagnostiske tester - presisering • Koblinger mellom begrepene via Bayes’ lov:
Dagens temaer • Stokastisk forsøk – sannsynlighetsfordeling • Binomisk fordeling • Poissonprosessen • Poissonfordeling
Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk forsøk: • Et eksperiment hvor utfallet ikke er kjent på forhånd • De enkelte utfall kan ha ulik sannsynlighet for å opptre Ex. - Terningkast - Responsen på en antibiotikakur • Deterministisk forsøk: • Et eksperiment hvor utfallet er gitt når inngangsdataene er spesifisert Ex. - Tidspunkt for soloppgang (for bestemt sted og dato) - Hastigheten til ei kule som slippes fra en viss høyde (Newton)
Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk variabel: • Tallstørrelse knyttet til utfallet av et stokastisk forsøk • Varierer tilfeldig fra forsøk til forsøk • Deles ofte i tellevariabler og målevariabler • Angis med stor bokstav (X, Y, …) Ex. Tellevariabler: - Antall ganger ”1” opptrer i løpet av 10 terningkast - Antall pasienter som oppsøker legevakten i løpet av et døgn Ex. Målevariabler: - Hemoglobinnivå i blodet - Levealder til en kreftpasient
Stokastisk forsøk – sannsynlighetsfordeling • Sannsynlighetsfordeling: • Beskriver den tilfeldige variasjonen til en stokastisk variabel • Angir sannsynligheten for de forskjellige mulige verdiene x av den stokastiske variabelen X, P(X=x) • Sannsynlighetene for de forskjellige mulige utfallene skal summere seg til 1, • Kan presenteres i tabellform eller grafisk som et histogram Ex. Terningkast: • Registrerer hvor mange ganger ”1” opptrer i løpet av 10 kast • Mulige verdier: 0, 1, 2, …, 10 • Ikke lik sannsynlighet for alle disse utfallene!
Stokastisk forsøk – sannsynlighetsfordeling • Forventningsverdi • Mål for tyngdepunktet (sentrum) i en sannsynlighets-fordeling • Varians og standardavvik • Mål for spredningen i en sannsynlighetsfordeling (høye verdier indikerer stor spredning)
Eksempel - myntkast • Kast en mynt tre ganger, og la X være antall kron • Da kan X ta verdiene 0,1, 2 og 3 • Sannsynlighetene for disse verdiene er henholdsvis 1/8, 3/8, 3/8 og 1/8 (gunstige / mulige) • Spørsmål: Hva er forventning, varians og standardavvik til X?
Stokastisk forsøk – sannsynlighetsfordeling • Regneregler for forventning og varians • For vilkårlige tall a og b gjelder: • For en sum av stokastiske variabler gjelder at
Stokastisk forsøk – sannsynlighetsfordeling • Stokastisk uavhengighet mellom variabler: • Utfallet til hver enkelt variabel blir ikke påvirket av utfallet til den andre. Matematisk: jfr. tidligere for uavhengige hendelser: Ex. Feber og sykkelfarge • For variansen til en sum av parvis stokastisk uavhengige variabler gjelder at
Stokastisk forsøk – sannsynlighetsfordeling • Sammenheng mellom gjennomsnitt og forventning? • Gjennomsnittsverdien i et datasett er en ren summasjon av observasjonene og er ikke generelt koblet til noen sannsynlighetsfordeling. • Begrepet forventningsverdi er derimot knyttet opp mot en stokastisk variabel med en nærmere bestemt sannsynlighetsfordeling og trenger ikke noe datasett for å kunne beregnes (såfremt sannsynlighets-fordelingen er kjent).
Binomisk forsøksrekke • Tenk deg et forsøk hvor vi ser på blodtypen til forskjellige personer og teller antall som har blodtype B • Anta uavhengighet mellom blodtypene til de enkelte personene • Dette er et eksempel på en binomisk forsøksrekke
Binomisk forsøksrekke • Definisjon: En binomisk forsøksrekke bestående av n enkeltforsøk må oppfylle følgende betingelser • De enkelte forsøk må være uavhengige av hverandre • I hvert enkeltforsøk registreres det om en begivenhet A inntreffer (suksess) eller ikke (fiasko) • Sannsynligheten for A er den samme i hvert forsøk Sannsynligheten for A betegnes p.
Binomisk forsøksrekke • Flere eksempler på binomiske forsøksrekker: • Terningkast • A: ”6”-er, p=1/6 • A: ”Like antall øyne”, p=1/2 • Barnefødsler • A: jente, p=1/2 • A: ryggmargsbrokk, p=0.001 • A: fødselsvekt < 2500g, p=… • Genetikk: Mor og far bærere av genet for cystisk fibrose • A: barn sykt, p=1/4
Binomisk forsøksrekke • Vi sier at antall suksesser (X) i en binomisk forsøksrekke er binomisk fordelt • Formel for sannsynligheten av utfallene i den binomiske fordelingen • Forventning og varians i den binomiske fordelingen
Binomisk forsøksrekke • Utledning av binomisk fordeling • Betrakter en binomisk forsøksrekke med n enkeltforsøk • Lar den stokastiske variabelen X betegne antall ganger A inntreffer • Sannsynlighetsfordelingen til X, P(X=x) = ?.
Eksempel – blodtype • Anta at 8% av en befolkning har blodtype B • Spørsmål: • Hva er sannsynligheten for at man i en gruppe på 10 personer finner én person med blodtype B? • To personer? • Hvor mange personer i gruppa kan forventes å ha blodtype B?
Poissonprosessen • Betrakt antall nye tilfeller av brystkreft registrert til et kreftregister i løpet av et år • Anta at: • raten av (eller sannsynligheten for) registreringer er lik gjennom hele perioden • registreringene skjer uavhengig av hverandre • ingen registreringer kan være fullstendig sammenfallende i tid • Vi har da et eksempel på en Poissonprosess
Poissonprosessen tid • Poissonprosessen framkommer når vi betrakter hendelser som fordeler seg tilfeldig over et kontinuum, f.eks. • Volum Ex. Plasseringen til røde blodlegemer i en mengde blod • Tid Ex. Registrering av krefttilfeller i løpet av et år
Poissonfordelingen • Antall hendelser/objekter X innenfor et område av kontinuumet sies å være Poissonfordelt • Sannsynlighetene i Poissonfordelingen er gitt ved hvor er forventet antall hendelser/objekter innenfor området (tidsperioden, volumet, …) man betrakter.
Poissonfordelingen • Poissonfordelingen som tilnærmelse til binomisk fordeling • Tommelfingerregel: En binomisk fordelt variabel er tilnærmet Poissonfordelt (med ) hvis • Dette er en ganske vanlig situasjon i medisin: liten sannsynlighet for hendelsen, men mange forsøk (=personer) • Direkte bruk av Poissonfordelingen som fordelingen til antall hendelser i en Poissonprosess kan være mer hensiktsmessig i situasjoner hvor vi ikke kjenner n og p
Eksempel – ryggmargsbrokk • Vi ønsker å se på forekomster av ryggmargsbrokk hos nyfødte • Antall fødsler på Ullevål sykehus i Oslo per år er ca. n = 5000 • P(ryggmargsbrokk) = 1 / 1000 • Spørsmål: Hva er sannsynligheten for at 6 barn fødes med ryggmargsbrokk i løpet av et år?
Eksempel - AIDS • Nye AIDS-tilfeller i 1991, registrerte tilfeller per uke, 47 uker: 1 1 0 1 2 1 3 0 0 0 0 0 0 2 1 2 2 1 3 0 1 0 0 0 1 1 1 1 1 0 2 1 0 2 0 2 1 6 1 0 0 1 0 2 0 0 0 • Gjennomsnittlig antall tilfeller per uke (fra dataene): 0.936 • Spørsmål: Hva er sannsynligheten for 0 nye AIDS-tilfeller i løpet av en uke?