280 likes | 555 Views
Põhjuslikkus ja statistika. Krista Fischer MRC Biostatistics Unit Cambridge, UK. M õningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden ’iga (MRC Clinical Trials Unit, UK). Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist?.
E N D
Põhjuslikkus ja statistika Krista Fischer MRC Biostatistics Unit Cambridge, UK ESS konverents "Statistika ja eluteadused"
Mõningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden’iga (MRC Clinical Trials Unit, UK) ESS konverents "Statistika ja eluteadused"
Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist? • Mis on põhjuslik seos? Kas seda saab matemaatiliselt defineerida? • Miks ja millal on meil vaja hinnata põhjuslikke seoseid? • Randomiseerimine: kas imevahend põhjuslikkuse kindlakstegemiseks? • Põhjuslike seoste hindamine randomiseeritud uuringutes – mida me tegelikult hindame (ja kas see on see, mida me hinnata tahame)? ESS konverents "Statistika ja eluteadused"
Seos X ja Y vahel: statistiline või põhjuslik? Kaks huvipakkuvat näitajat: • X – ekspositsioon (eluviisidest või keskkonnast tulenev riskitegur) • Y – väljundnäitaja (haigestumine, suremus) Kaks küsimust: • Kas X ja Y vahel on seos? • Kas tunnus X mõjutab tunnust Y? Need kaks küsimust ei ole samaväärsed! ESS konverents "Statistika ja eluteadused"
Kas X ja Y vahel on seos? Lihtsustame ülesannet: olgu mõlemad tunnused binaarsed (väärtused 0 ja 1 vastavad ekspositsiooni/tervisetulemi puudumisele ja olemasolule) Seos on olemas, kui P(Y=1|X=1) ≠P(Y=1|X=0) Lihtne testida, kuid kahjuks ei näita põhjuslikkust. ESS konverents "Statistika ja eluteadused"
Statistiline vs põhjuslik seos P(Y=1|X=1) ja P(Y=1|X=0) Iseloomustavad haiguse Y esinemissagedust kahes rahvastikurühmas. Neid rühmi eristab ekspositsioon X (nt suitsetamine: jah/ei), kuid nad võivad erineda veel paljude muude näitajate poolest. ESS konverents "Statistika ja eluteadused"
Statistiline vs põhjuslik seos vaatlusuuringutes U – muud näitajad ? X - ekspositsioon Y - haigus ESS konverents "Statistika ja eluteadused"
Kuidas defineerida põhjuslikku mõju? Kujutame ette sekkumist, mis suudaks tunnuse X väärtust muuta vastavalt soovile kas 1-ks või 0-ks kõigil indiviididel. P(Y=1|do(X)=1): tõenäosus, et Y=1 kui tunnuse X väärtus on kogu üldkogumis seatud olema 1. Samamoodi defineerime P(Y=1|do(X)=1) (Tähistust kasutas esimesena J. Pearl) Üldkogumi keskmine põhjuslik mõju on nüüd defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0) ESS konverents "Statistika ja eluteadused"
Kuidas defineerida põhjuslikku mõju? Üldkogumi keskmine põhjuslik mõju on defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0) Või, alternatiivselt defineerime nn potentsiaalsed tunnused Y(1) = Y(do(X)=1) ja Y(0) = Y(do(X)=0) Nüüd: ACE = E[Y(1) – Y(0)] Kas ACE on see, mida meil tegelikult vaja on? ESS konverents "Statistika ja eluteadused"
Ekspositsiooni mõju eksponeeritutel Vahel on mõttekam rääkida ekspositsiooni mõjust neile, kes tegelikult eksponeeritud on (meid ei huvita niivõrd see, kui palju suureneks praeguse mittesuitsetaja haiguserisk kui ta suitsetaks, vaid huvitab, kui palju väheneks suitsetaja haiguserisk kui ta ei suitsetaks). Keskmine ekspositsiooni mõju eksponeeritutel: (Average Treatment effect in the Treated) ATT= P(Y=1|X=1) - P(Y=1|X=1,do(X)=0) EhkATT = E[Y-Y(0)|X=1] ESS konverents "Statistika ja eluteadused"
Põhjusliku mõju hindamine ACE on teoreetiliselt hinnatav, kui X on randomiseeritav - juhuvalim üldkogumist jagatakse juhuslikkuse alusel kaheks osaks, ühele osale määratakse X=1, teisele X=0. Sellises uuringus P(Y=1|do(X)=x) = P(Y=1|X=x). Kahjuks ei ole selline uuring enamasti praktiliselt teostatav. ESS konverents "Statistika ja eluteadused"
Statistiline vs põhjuslik seos ideaalses randomiseeritud uuringus U – muud näitajad R - randomiseerimine ? X - ekspositsioon Y - haigus P(Y=1|X=x) = P(Y=1|do(X)=x) ESS konverents "Statistika ja eluteadused"
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Suhteline risk ravirühmas võrreldes kontrolliga = 2 See ei ole ACE ega ATT! ESS konverents "Statistika ja eluteadused"
Statistiline vs põhjuslik seos reaalses randomiseeritud uuringus U – muud näitajad R - randomiseerimine ? X - ekspositsioon Y - haigus P(Y=1|X=x) ≠ P(Y=1|do(X)=x) Siiski – R on instrument! ESS konverents "Statistika ja eluteadused"
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku ESS konverents "Statistika ja eluteadused"
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Eeldame, et ravimi määramisel otsest mõju ei ole (nende jaoks kes ravimit ei saa) ESS konverents "Statistika ja eluteadused"
Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Suhteline risk potentsiaalsete ravimisaajate hulgas: 450/200=2.25 See ongi hinnang ATT-le! ESS konverents "Statistika ja eluteadused"
Realistlik randomiseeritud uuring II: ei suudeta tagada kontrollrühma täielikku mitte-eksponeeritust, ega ka ravirühma 100%-list eksponeeritust Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku Suhteline risk ravirühmas võrreldes kontrolliga = 0.63, riskide vahe 0.029 ehk 2.9% See ei ole ACE ega ATT! ESS konverents "Statistika ja eluteadused"
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variandid: A Eeldada, et nende seas on ravimi mõju samasugune kui ravimivõtjatel ravimirühmas B Eeldada, et nende seas puudub ravimi määramise mõju – nii nende ekspositsiooni kui ka tulemusnäitaja tase ei sõltu sellest, kummasse rühma nad on määratud Eeldame ka endiselt, et ravimi määramise põhjuslik mõju puudub nende hulgas, kes ravimirühmas ravimit ei võtnud (Viimased kaks eeldust väidavaid, et nn põhimõttelisi vastuhakkajaid ei ole) ESS konverents "Statistika ja eluteadused"
Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variant A viib mudelini ATT jaoks: E[Y - Y(0)| X=x, R=r] = ψx ehk E[Y | X=x, R] – ψx = E[Y(0) | X=x, R=r] = E[Y(0) | X=x] eeldusel, et randomiseerimine on korrektne – seega Y(0) ei sõltu randomiseerimisest Nii osutub sobivaks selline ψ hinnang, mille korral Y- ψx ei sõltu R-st Selle saame, kui keskmine tulemite vahe jagada keskmise ekspositsioonide vahega: ψh = (µy1 – µy0)/(µx1 – µx0) HR uuringus ψh = -0.041 ehk -4.1% ESS konverents "Statistika ja eluteadused"
Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variant B viib mudelini “kuulekate” keskmise põhjusliku mõju (CACE-complier average causal effect) jaoks: E[Y(1) – Y(0)|X(1)=1, X(0)=0] = ψ, Kus X(0) ja X(1) on indiviidi potentsiaalsed ekspositsioonitasemed ravi- ja kontrollrühmas. CACE iseloomustab põhjuslikku mõju kitsamas rühmas kui ATT Kas ja millistel eeldustel saame hinnata ekspositsiooni mõju nende hulgas, kes võtaksid ravimit siis ja ainult siis kui nad on randomiseeritud ravimirühma? ESS konverents "Statistika ja eluteadused"
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku ESS konverents "Statistika ja eluteadused"
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku ESS konverents "Statistika ja eluteadused"
Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku CACE = - 0.04 (-4%) ESS konverents "Statistika ja eluteadused"
CACE vs ATT HR uuringusselgus, et CACE = ATT = - 0.04 (-4%) • Osutub, et ka matemaatiliselt on nii tuletatud CACE hinnang ekvivalentne eelnevalt tuletatud ATT hinnanguga! • Sellest hoolimata tuleb silmas pidada, et eeldused ja seega ka tõlgendus sõltuvad sellest, kas hinnatavaks suuruseks on ATT või CACE. • Analoogselt saab tuletada ka CACE ja ATT riskisuhte hinnangud ja jälle näidata, et nad on võrdsed. • Šansisuhte hinnangud on aga erinevad! ESS konverents "Statistika ja eluteadused"
Kokkuvõte • Põhjuslikud seosed ei ole üheselt matemaatliselt defineeritavad • Põhjuslikke mõjusid hinnates peaks küsima: • kas ja millise mõju hindamine on tegelikult huvi pakkuv? • Kas ja milliseid eeldusi oleme nõus tegema konkreetse uuringu jooksul, et huvipakkuvad mõjud oleks hinnatavad? • (Nt HR uuringuseipruugieieeldus A ega B kehtida!) • Hinnatud põhjuslike mõjude tõlgendus ja hinnangute valiidsus sõltuvad tehtud eeldustest ja nende paikapidavusest ESS konverents "Statistika ja eluteadused"
Randomiseerimine looduse poolt:Mendelian randomization Vahel, kuirandomiseerituduuringutkorraldadaeisaa, võibabi olla geenidest! Näide: teatudgeneetilinemutatsioontakistabalkoholilagundamistseedesüsteemipoolt. Teadlased on üsnaveendunud, et seesamamutatsiooneimõjutaotseseltsüdamehaigustessehaigestumist. Sisuliseltkäitub see geen just samamoodinagurandomiseerimine -- muudsüstemaatilisterinevustsellegeenigajailmaselletainimestehulgas, pealenendeerinevaalkoholitarbimisetaseme. Uuringut, kus on kogutudsobivaidgeeniandmeid, samutiandmeidekspositsioonijaväljundtunnusekohta, saabanalüüsidasamamoodikuitavalistrandomiseerituduuringut! ESS konverents "Statistika ja eluteadused"
Kirjanduseviiteid • Pearl, J., koduleht hulga põhjusliku analüüsi alase materjaliga http://bayes.cs.ucla.edu/jp_home.html (seotult ka tema raamatuga “Causality”) • Sheehan, N., Didelez, V., jt. Mendelian Randomization and Causal Inference in Observational Epidemiology, PLoS Med. 2008 August; 5(8). http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2522255/?tool=pubmed ESS konverents "Statistika ja eluteadused"