320 likes | 473 Views
The Chain Rule for Influence Diagrams, Strategies and Expected Utilities. 227-251. Sisältö. Vaikutuskaavion ketjusääntö Strategia ja hyödyn odotusarvo Muuttujien eliminointi Toimintajärjestysverkot Tiedon arvo Rajoitetun muistin vaikutuskaaviot Yhteenveto & kotitehtävä. Sisältö.
E N D
The Chain Rule for Influence Diagrams, Strategies and Expected Utilities 227-251
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Esimerkki: D1=Markkinointi käyntiin T=Kyselyjä yrityksiltä? D2=Go / No go A=Näkyvyyttä? B=Jälleenmyyjiä? C=Lipunmyynti hyvä? V1=Mainostuloja V2=Lipputuloja
Vaikutuskaavio D1=Markkinointi käyntiin T=Kyselyjä yrityksiltä? D2=Go / No go A=Näkyvyyttä? B=Jälleenmyyjiä? C=Lipunmyynti hyvä? V1=Mainostuloja V2=Lipputuloja
Vaikutuskaavion ketjusääntö Teoreema 7.1: Olkoon vaikutuskaavio: Tällöin Yllättävä tulos? Konsertille:
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Määritelmiä Toimintajärjestys päätökselle D (policy) on kuvaus, joka määrittää kunkin D:n historian pohjalta päätöksen D Vaikutuskaavion strategiaon joukko toimintajärjestyksiä – yksi kullekin päätökselle Vaikutuskaavion ratkaisu onodotetun hyödyn maksimoiva strategia
Strategia ja hyödyn odotusarvo Muunnetaan vaikutuskaavio päätöspuuksi ja ratkaistaan se päätös kerrallaan. Saadaan toimintajärjestys (policy) ja hyötyfunktio. Esim. konsertille Go / no go kohtaan:
V1+V2 AxC V1+V2 D2 AxC T D1 D2 T
Yleisesti: teoreema 7.2 Additiivisille hyödyille, n:lle päätökselle optimaalinen toimintajärjestys: Tuoton odotusarvo toimintajärjestyksestä
teoreema 7.2 (jatkoa) Strategia, joka tuottaa vaikutuskaavion jokaiselle päätökselle optimaalisen toimintajärjestyksen, tuottaa myös maksimaalisen tuoton odotusarvon:
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Muuttujien eliminointi Myös vaikutuskaaviossa pyritään eliminoimaan muuttujia. Aikajärjestys on otettava huomioon, joten sattuma- ja päätösmuuttujien välinen (vahvaksi kutsuttu) eliminointijärjestys on seuraava: Kirjassa on algoritmi sivuilla 237-238
Vahvat liitospuut Muodostetaan moraalikaavio: • Poistetaan päätöksiä edeltävät nuolet • Muodostetaan moraaliset linkit • Poistetaan nuolten suunnat • Poistetaan hyötysolmut
Moraalikaavio Eliminointijärjestys: Decision,G,H,I,J,C,B, D,L,A,F,E,K
Vahva kolmiointi ja vahva liitospuu Kun seurataan vahvaa eliminointijärjestystä saadaan aikaiseksi vahva kolmiointi. Vaadittavat linkit vedetään solmujen välille, jotta eliminointi olisi mahdollista. Vahva liitospuu muodostetaan vahvan kolmioinnin antaman kaavion mukaisesti.
Vahva liitospuu L,K,E,F,A L A E Decision,G,H,I,J,L A,B,C D,E,K
Relevantti menneisyys Kun päätös i eliminoidaan, otetaan huomioon ainoastaan potentiaalit, joiden määrittelyalueessa päätös i on. Suomeksi: jo eliminoidut muuttujat unohdetaan ja jäljellä olevista otetaan huomioon vain ne, jotka kuuluvat samaan klikkiin. Nämä muodostavat relevantin menneisyyden.
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Toimintajärjestysverkot Halutaan laskea todennäköisyysjakaumia systeemille. Vaihdetaan päätössolmut sattumasolmuiksi (vanhemmiksi relevantin menneisyyden solmut), niin että ehdollinen todennäköisyys on 1 tehdylle päätökselle ja 0 muille. Kirja antaa esimerkkejä toimintajärjestysverkkojen käytöstä: riskiprofiilit, onnistumisen todennäköisyys, odotetun hyödyn varianssi.
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
V C TC Tiedon arvo C Tiedon hankkiminen voi maksaa. Kannattaako käyttää jonkin tilan huomioimiseen resursseja? • Poistetaan yhteys päätökseen vaikuttavaan sattumasoluun • Lasketaan uuden kaavion maksimiodotusarvo. • Jos odotusarvo on suurempi kuin alkuperäisessä, ei havaintoa kannata tehdä.
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Rajoitetun muistin vaikutuskaavio Ongelma: relevantin tiedon määrä voi kasvaa suureksi. Ratkaisu: rajoitetaan muistin käyttöä Käytännössä: • Informaation estäminen (4.6.3) • LIMID (rajoitetun muistin vaikutuskaavio)
Limid Poistetaan unohtamattomuusoletus: määritetään kuinka pitkälle menneisyyteen muistetaan. Toimintajärjestysverkot sopivat rajoitetun muistin vaikutuskaavioiden muodostamiseen. Muodostetaan ja ratkaistaan yhden päätöksen vaikutuskaavio muuttuja kerrallaan aloittaen lopusta. Saadaan optimaalinen strategia LIMID:ille (muttei välttämättä alkuperäiselle).
Sisältö • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot • Yhteenveto & kotitehtävä
Yhteenveto & kotitehtävä Tee esitelmän yhteenveto kirjoittamalla yksi tärkeä pointti kustakin seuraavasta kohdasta: • Vaikutuskaavion ketjusääntö • Strategia ja hyödyn odotusarvo • Muuttujien eliminointi • Toimintajärjestysverkot • Tiedon arvo • Rajoitetun muistin vaikutuskaaviot