210 likes | 315 Views
Bayesilainen tilastoanalyysi - lähtökohta, motivointi ja peruskäsitteet. (Bayeslaisen) tilastoanalyysin tavoite on päätellä tuntemattomien suureiden arvoja havaittujen muuttujien perusteella
E N D
Bayesilainen tilastoanalyysi- lähtökohta, motivointi ja peruskäsitteet • (Bayeslaisen) tilastoanalyysin tavoite on päätellä tuntemattomien suureiden arvoja havaittujen muuttujien perusteella • Bayesilaisessa tilastotieteelle on ominaista todennäköisyysmallien ekplisiittinen käyttö kaiken epävarmuuden kuvaamisessa ja mittaamisessa • Analyysin vaiheet: • kokonaistodennäköisyysmallin laatiminen • ehdollistaminen havaintojen suhteen • mallin hyvyyden arviointi
Bayesilainen tilastoanalyysi- lähtökohta, motivointi ja peruskäsitteet • kokonaistodennäköisyysmalli = mallin tai tarkasteltavan tilanteen kaikkien muuttujien (havaittavien, tuntemattomien ja parametrien) yhteisjakauma • mallin on vastattava tarkasteltavaa ilmiötä koskevaa tieteellistä tietoa ja tiedonkeruuprosessia • ehdollistaminen havaintojen suhteen = tuntemattomien muuttujien ehdollisen jakauman määrittäminen kun havaittavien muuttujien arvo tunnetaan, posteriorijakauman ja ennustavan jakauman määrittäminen
Bayesilainen tilastoanalyysi- lähtökohta, motivointi ja peruskäsitteet • mallin arviointi = mallin sopivuuden ja sen seurausten arviointi, herkkyystarkastelut, subjektiivisten oletusten eksplisiittinen arviointi • ominaista Bayes-malleille on tilastollisten johtopäätösten selkeä tulkinta (esim. luottamusvälit) • mallien joustavuus ja yleisyys • epävarmuuden selkeä ilmaiseminen todennäköisyyksillä • hierarkisuus
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet • tilastolliset johtopäätökset koskevat koko populaatiota mutta ne perustuvat otokseen • syy-seuraussuhteen selvittämiseksi tarvitaan tilastollista päättelyä • kahdenlaisia estimoitavia tai arvioitavia suureita l. estimandeja: • havaitsemattomat suureet (tulevat muuttujien arvot), joiden arvo joko havaitaan tulevaisuudessa tai se on periaatteessa mahdollista havaita • parametrit, joita ei voida suoraan havaita, mutta joita käytetään hyväksi mallissa (esim. regressiokertoimet, jakaumien parametrit)
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Parametrit, data ja ennusteet • havaitsemattomat muuttujat, esim. parametrit • havaittavat muuttujat, y • tuntemattomat, mutta havaittavissa olevat muuttujat (esim. tulevaisuudessa havaittavat prosessimittausten arvot), y
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Vaihdettavuus • muuttujat y1, y2,..., ynovat vaihdettavia, jos mikä tahansa permutaation yi, yj,..., ylyhteisjakauma p(yi, yj,..., yl ) on sama • de Finettin esityslause: y1, y2,..., ynovat vaihdettavia <=> kunkin yi:n jakauma muotoa • jos muuttujat ovat vaihdettavia, niin ne voidaan korvata tilastollisessa päättelyssä toisillaan
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Selittävät muuttujat • selittävät muuttujat liittyvät kuhunkin havaintoyksikköön, ja kuvaavat sen ominaisuuksia (esim. kliinisessä kokeessa potilaan ikä, potilaan lääkitys tai hoito yms.) • esim. regressiomallin selittävät muuttujat • i. havaintoyksikkö on muotoa (x, y)i, missä x on yksikön ominaisuuksia kuvaava selittävä muuttuja, ja y on (kokeessa) havaittava muuttuja • vaihdettavuuden tulkinta: jos muuttujan y ehdollinen jakauma p(y|x) on samanlainen kaikille havaintoyksiköille, siten että jos kahta tai useampaa yksikköä kuvaa sama x niin vastaava muuttujan y jakauma on sama, niin yksiköt ovat vaihdettavia
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Hierarkiset mallit • hierarkisissa malleissa voidaan puhua vaihdettavuudesta usealla mallintamistasolla • hierarkiset mallit voidaan esittää graafisesti verkkoina
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely • parametreja ja tuntemattomia muuttujia koskevat tilastolliset väittämät esitetään todennäköisyysväittäminä • todennäköisyysväittämät ovat muotoa: p(y) tai p(y|y) • jotta yo. muotoa olevia väittämiä voidaan esittää, on muodostettava muuttujien ja y yhteisjakauma, p(y) = p(y| p( • p(y| on ns. otosjakauma (sampling distribution) • p(on muuttujan on priorijakauma
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely • Bayesin kaavalla voidaan voidaan laskea ehdollinen jakauma p(|y
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely; ennustavat jakaumat • ennenkuin y on havaittu, sitä koskeva epävarmuus kuvataan reunajakaumalla (a priori ennustava jakauma)
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely; ennustavat jakaumat • kun y on havaittu samanlaisen tai samassa asemassa olevaa, mutta tuntematonta muuttujaa y koskeva epävarmuus kuvataan (a posteriori) ennustavalla jakaumalla
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely; likelihoodfunktio • kun Bayesin kaavaa käytetään edellä esitetyllä tavalla, vaikuttaa havaittu data (y) tilastolliseen päättelyyn ainoastaan funktion p(y| kautta • funktiota p(y| kutsutaan likelihood- l. uskottavuusfunktioksi • Bayesilainen päättely noudattaa ns. likelihoodperiaatetta, jonka mukaisesti kaikki todennäköisyysmallit, joilla on (vakiokerrointa vaille) sama likelihoodfunktio, johtavat samoihin tilastollisiin johtopäätöksiin
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely; likelihood- ja vedonlyöntisuhteet (likelihood ratio / odds ratio) • posterioritiheyksien suhdetta p(1|y)/ p(2|y) kutsutaan posteriori odds suhteeksi (posterior odds ratio), ja pätee
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Bayesilainen tilastollinen päättely; likelihood- ja vedonlyöntisuhteet (likelihood ratio / odds ratio) • posteriori odds suhde on siis priori odds suhde likelihoodsuhde • likelihoodsuhde määritellään kaavalla
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Todennäköisyys epävarmuuden mittana • Bayesilaisessa tulkinnassa todennäköisyys on kaiken epävarmuuden mitta • todennäköisyys on rationaalisen uskomuksen aste • todennäköisyys riippuu subjektista ja hänen tietämyksestään • ainutkertaisten tapahtumien todennäköisyys • päätösteoreettinen tausta
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Käyttökelpoisia todennäköisyyslaskennan tuloksia • yhteisjakaumien esittäminen ehdollisten jakaumien avulla (huom! myös graafiset esitykset)
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Käyttökelpoisia todennäköisyyslaskennan tuloksia • ehdolliset odotusarvot ja varianssit
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Käyttökelpoisia todennäköisyyslaskennan tuloksia • ehdolliset odotusarvot ja varianssit
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Satunnaismuuttujien muunnokset
Bayesilainen tilastoanalyysi- tausta, motivointi ja peruskäsitteet Satunnaismuuttujien muunnokset esim. logit- muunnos