210 likes | 379 Views
Bayes. Voor psychologen. Recap Bayes’ Rule. Pierre Simon Laplace. Als een test .99 van de patienten detecteert die aan ziekte Z lijden (dit is erg hoog voor een medische test!) …,. en mijn testresultaat blijkt positief…. …hoe waarschijnlijk is het dan dat ik Z heb?.
E N D
Bayes Voor psychologen
Recap Bayes’ Rule Pierre Simon Laplace
Als een test .99 van de patienten detecteert die aan ziekte Z lijden (dit is erg hoog voor een medische test!)…, en mijn testresultaat blijkt positief… …hoe waarschijnlijk is het dan dat ik Z heb?
Vraag1 1: hoe prevalent is Z? Stel: 1 patient op de 1000 Vraag 2: Hoe veel false alarms? . Stel: 2 op de 100 gezonde mensen die worden getest. (Heel goede test! Veel beter dan PSA- niveau voor prostaatkanker en mammogram voor borstkanker!!!) Kans is .047
Lijkt .047 erg laag? Probeer een ruwe benadering: Test een groep van 1000 mensen Daarbij kun je redelijkerwijze 1 zieke verwachten die hoogstwaarschijnlijk een positieve uitslag krijgt Van de bijna 1000 gezonden zullen er ongeveer 20 ten onrechte een positieve uitslag krijgen. Van de 21 positieven is er dus ongeveer 1 ziek, dat is dus een kans van ongeveer .048
Preciezer: 100000 100 99900 99 -+ 1 -- 1998…+ 97902….- .1% 1% 2% 99 ziek op 1998+ 99 = 2097 positieven:.04721
Zo’n redenering helpt voor intuitief begrip, maar is niet werkelijk valide: ook bij een steekproef van 10000 weet je niet zeker dat er precies 100 mensen ziek zijn! Voor een formele behandeling van dit soort vragen moet men meer weten. Vooral kansen en voorwaardelijke kansen De kans op A: p(A) De kans op A gegeven B: p(A|B) Eerst een voorbeeld, dan een definitie.
De kans op A gegeven B: p(A|B) een voorbeeld, p(even) = 5/10 =1/2 • 4 7 • 10 3 • 1 8 5 • 9 2
De kans op A gegeven B: p(A|B) een voorbeeld, p(even) = 5/10 = 1/2 p(deel3) = 3/10 4 7 6 10 3 1 8 5 9 2
De kans op A gegeven B: p(A|B) een voorbeeld, p(even) = 5/10 = 1/2 p(deel3) = 3/10 p(even) = 5/10 = 1/2 p(deel3) = 3/10 p( even ^ deel3) = 1/10 4 7 6 10 3 1 8 5 92
De kans op A gegeven B: p(A|B) een voorbeeld, p(even) = 1/5 = ½ p(deel3) = 3/10 p(even ^ deel3) = 1/10 Kans op even gegeven deel3: p(even|deel3) = 1/3 p(even^deel3) 1/10 =----------------------- = ------ p(deel3) 3/10 4 7 610 3 185 92
De kans op A gegeven B: p(A|B) een voorbeeld, p(even) = 1/5 = ½ p(deel3) = 3/10 p(even ^ deel3) = 1/10 p(even|deel3) = 1/3 = p(even^deel3) 1/10 -------------------- = ------ p(deel3) 3/10 47 6 10 3 18 5 92 Kans op deel3 gegeven even: p(deel3|even) = p(even^deel3) 1/10 1 ---------------------- = -------- = --- p(even) 5/10 5
Een regel die verband legt tussen p(A|B) en p(B|A)is heel belangrijk voor psychologen! Onderzoeker weet(?) p(gedrag|proces) Maar wil weten p(proces|gedrag) Diagnost weet p(testuitslag|stoornis) Maar wil weten p(stoornis|testuitslag) Statisticus weet p(steekproef|populatie) Maar wil weten p(populatie|steekproef) Waarnemer “weet” p(stimuli|wereld) Maar “concludeert” p(wereld|stimuli)
p(A^B) p(A|B) = ---------- p(B) p(A^B) en p(B|A) = ------------ p(A) p(B|A)•p(A) p(A|B)= -------------- p(B) [basisvorm] p(B|A)•p(A) = p(A^B) p(B) = p(B^A) + p(B^¬A) =p(B|A)•p(A)+p(B|¬A)•p(¬A) p(B|A)•p(A) p(A|B)= ------------------------------------------ p(B|A)•p(A) + p(B|¬A)•p(¬A) [standaardvorm]
p(B|A)p(A) p(A|B)= ------------------ p(B) p(B|A)•p(A) p(A|B)= --------------- p(B) [basisvorm] p(B|A)•p(A) p(A|B)= ------------------------------------------- p(B|A)•p(A) + p(B|¬A)•p(¬A) [standaardvorm] Odds i.p.v. waarschijnlijkheid: Ω(A) = p(A)/p(¬A) p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A) posterior odds = likelihood ratio • prior odds
De odds vorm is heel aardig om te laten zien wat er gebeurt als je nieuwe informatie krijgt: p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A) De diagnostische “kwaliteit” van nieuwe informatie B (likelihood ratio) Je oorspronkelijke geloof in A (prior odds) Je nieuwe geloof in A, nu je B weet (posterior odds)
Niet vergeten: p(B|A)•p(A) p(A|B)= -------------------- [basis] p(B) p(B|A)•p(A) p(A|B)= ------------------------------------- p(B|A)•p(A) + p(B|¬A)•p(¬A) p(B|Ai)•p(Ai) p(Ai|B) = ------------------ [gegeneraliseerde jp(B|Aj)•p(Aj) standaardvorm] p(A|B) p(B|A) p(A) ------------- = --------- • ----------- [‘odds’] p(¬A|B) p(B|¬A) p(¬A)
Opnieuw het ziektevoorbeeld: 99% van zieken positief [p(Pos|Z)] 2% van gezonden positief [p(Pos|¬Z)] 0.1% zieken [p(Z)] p(Pos|Z)•p(Z) p(Z|Pos)= ----------------------------------------- p(Pos|Z)•p(Z) + p(Pos|¬Z)•p(¬Z) .99 • .001 .00099 = ------------------------ = ------------ = .047 .99 •.001 + .02 •.999 .020079
In de odds vorm: p(A|B) p(B|A) p(A) ------------- = ------------- • -------- p(¬A|B) p(B|¬A) p(¬A) .001 ------ .999 (lage) prior odds .99 ----- .02 (hoge) diagnostische waarde (49.5) .0495 (nog steeds lage) posterior odds
Problemen: Wat is kans? (verschillende antwoorden: - (limiet van) relatieve frequentie - maat voor sterkte van geloof - mate waarin hypothese wordt ondersteund door evidentie) Kun je zeggen dat een unieke gebeurtenis of de toestand op dit moment (de kans dat ik nu Z heb) een kans p heeft?