1 / 24

Tommi Kauppinen ja Tuukka Sarvi

Oppiminen Bayes-verkoissa II D. Heckerman.  A Tutorial on Learning with Bayesian Networks.  In Learning in Graphical Models, M. Jordan, ed.. MIT Press, Cambridge, MA, 1999. NIPS 2001 Tutorial: Learning Bayesian Networks From Data. Nir Friedman and Daphne Koller. Tommi Kauppinen ja Tuukka Sarvi.

emelda
Download Presentation

Tommi Kauppinen ja Tuukka Sarvi

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Oppiminen Bayes-verkoissa IID. Heckerman.  A Tutorial on Learning with Bayesian Networks.  In Learning in Graphical Models, M. Jordan, ed.. MIT Press, Cambridge, MA, 1999.NIPS 2001 Tutorial: Learning Bayesian Networks From Data. Nir Friedman and Daphne Koller Tommi Kauppinen ja Tuukka Sarvi

  2. Esitelmän sisältö • Rakenteen ja parametrien oppiminen • Pisteytysmenetelmät • Täysi Bayes • Epätäydellinen data • Case: College plans • Yhteenveto

  3. Rakenteen ja parametrien oppiminen • Tilanne: meillä on datajoukko ,josta pitää määrittää sekä Bayes-verkon rakenne että parametrit • Määritettävä kaaret ja todennäköisyydet • Määritellään satunnaismuuttuja S, jonka tilat vastaavat eri rakennevaihtoehtoja • Jo pienellä muuttujamäärällä mahdollisia verkkoja suuri määrä (ylieksponentiaalinen) • Eri lähestymistapoja: mallien pisteytys ja täysi Bayes

  4. Mallien pistetys • Määritetään pisteytysfunktio, joka kertoo kuinka hyvin malli vastaa dataa • Etsitään suurimman pistearvon tuottavaa rakennetta • Suurin osa Bayes-verkkojen oppimista käsittelevästä kirjallisuudesta keskittyy mallien pisteytykseen ja valintaan • Monia pisteytystapoja, esim. likelihood score, cross-validation score • Parhaat pisteet saava malli etsitään laskemalla kaikki vaihtoehdot läpi tai käyttämällä jotain etsintäalgorimia rakennevaihtoehtojen S joukossa

  5. Mallien pisteytys: selventävä kuva

  6. Likelihood score • Logaritmi todennäköisyydestä, että malli tuottaa annetun datan D: • Todennäköisyys saadaan kaavasta: • on datasta laskettu parametrijakauma

  7. Cross-validation score • Opetetaan malli (päivitetään parametrit) datalla V, jossa on jätetty pois yksi havainto: • Lasketaan tn. poisjätetylle havainnolle • mitä suurempi tn. saadaan sitä suuremmat pisteet • Lasketaan eri havainnot poisjättämällä saadut pisteet yhteen:

  8. Esim. kaksi kolikkoa • Kaksi kolikkoa X ja Y sekä data seitsemästä heitosta • Kaksi mallia S1 ja S2 • Lasketaan likelihood score molemmille

  9. Esim. kaksi kolikkoa: malli S1 • Halutaan laskea: • Bayesin kaavalla: • Sijoitetaan, jolloin saadaan: • on parametrien priori-jakauma mallissa S1 • p(D|S1) on datan priori-todennäköisyys mallissa S1

  10. Esim. kaksi kolikkoa: malli S1 • Datasta saadaan: • Priori-tn. oletetaan tasajakautuneeksi: • Datan priori-tn. integroimalla: • Nyt saadaan alkup. lauseke:

  11. Esim. kaksi kolikkoa • S1:lle saadaan likelihood score: • Vastaavasti lasketaan S2:n likelihood score: • S2:n pistemäärä suurempi => S2 on parempi malli datan valossa • Tämä on järkevää kun tarkastellaan dataa

  12. Täysi Bayes • Lasketaan datan perusteella posteriori-todennäköisyydet p(S|D) ja jokaiselle mallille • p(S|D) Bayesin kaavasta: • Käytetään saatuja posteriori-todennäköisyyksiä laskettaessa haluttuja odotusarvoja • Esim. lasketaan datajoukkoa D seuraavan havainnon jakauma:

  13. Täysi Bayes: selventävä kuva

  14. Täysi Bayes vs. pisteytys • Täysi Bayes –menetelmässä säilytetään mukana kaikki mallit • Pistetysmenetelmissä valitaan paras malli • Täysi Bayes antaa kattavampia ennusteita • kaikki mahdollisuudet säilytetään mukana • Täysi Bayes laskennallisesti raskasta • mahdollisia malleja suuri määrä • Käytännössä parempi käyttää pisteytysmenetelmää

  15. Epätäydellinen data • Datan epätäydellisyydessä voidaan erottaa kaksi eri tapausta • Puuttuvat arvot datassa • Puuttuvat tai piilotetut muuttujat (hidden variables)

  16. Puuttuvat arvot datajoukossa ja EM (expectation maximization) • EM on metodi, jossa puuttuvat arvot datassa täydennetään olemassa olevan Bayes-verkon avulla • Saatuja arvoja käytetään kuin mitattuja

  17. Data: oletetaan tunnetuksi: Tästä saadaan arviot eri yhdistelmille X, Y. N(X,Y): Esim. EM (expectation maximization):

  18. Puuttuvat muuttujat (hidden variables) • Ei suoraa metodia löytää puuttuvia solmuja • Erilaisia heuristisia metodeja olemassa • puretaan toisistaan riippuvien muuttujien osaverkko kulkemaan yhteisen muuttujan kautta • Testataan verkkoa epäilyttävissä kohtaa lisäämällä mahdollisia puuttuvia muuttujia ja vertailemalla saatujen verkkojen ilmenemistodennäköisyyksiä alkuperäiseen

  19. Puuttuvat muuttujat: selventävä kuva • (a) Datan perusteella saatu verkko (mitatut muuttujat) • (b) Ehdotus puuttuvien muuttujien lisäämiseksi

  20. Case: College plans • Muuttujat: sex (SEX): male, female; socioeconomic status (SES): low, lower middle, upper middle, high; intelligence quotient (IQ): low, lower middle, upper middle, high; parental encouragement (PE): low, high; college plans (CP): yes, no • Data: tiedot 10318 Wisconsin high school oppilaista • Tarkoitus: saada tietoa muuttujien syy-seuraus-suhteista • Lähteet: data Sewell & Shah (1968) ja analyysi D. Heckerman (1999)

  21. Case: College plans • Kuvassa kaksi todennäköisintä rakennetta • Epäilyttävää: SES vaikuttaa suoraan IQ:iin

  22. Case: College plans • Lisättiin puuttuva muuttuja H selittämään muuttujia IQ ja SES • Malli 2*1010 kertaa todennäköisempi kuin paras malli ilman muuttujaa H • Muuttuja H vastaa ”vanhempien laatua”

  23. Yhteenveto: oppivat Bayes-verkot • Auttaa mallin rakentamisessa • Opitaan kahta asiaa: parametrit (todennäköisyydet) ja rakenne (kaaret) • Käytännössä tärkein menetelmä: parhaan rakenteen ja parametrien etsiminen pisteytysmenetelmillä • Epätäydellisen datan kaksi tapausta: puuttuvat arvot ja puuttuvat muuttujat • Suuri potentiaali, monia toimivia sovelluksia

  24. Kotitehtävä 28 • (a) Todista, että N muuttujan tapauksessa mahdollisten verkkojen määrä on suurempi kuin N! (ylieksponentiaalinen). (3p) • (b) Keksi ongelma, johon voisit käyttää oppivia Bayes-verkkoja. Listaa tutkittavat muuttujat ja kerro mistä saat dataa mallisi opettamiseksi. (3p)

More Related