730 likes | 1.02k Views
Patologija v hevrističnih preiskovalnih algoritmih. Mitja Luštrek. Doktorska disertacija Mentor: akad. prof. dr. Ivan Bratko Somentor: prof. dr. Matjaž Gams. Hevristični preiskovalni algoritmi. Stanja. Prehodi med stanji. Prostor stanj. Hevristični preiskovalni algoritmi. Trenutno stanje.
E N D
Patologija v hevrističnihpreiskovalnih algoritmih Mitja Luštrek Doktorska disertacija Mentor: akad. prof. dr. Ivan Bratko Somentor: prof. dr. Matjaž Gams
Hevristični preiskovalni algoritmi Stanja Prehodi med stanji Prostor stanj
Hevristični preiskovalni algoritmi Trenutno stanje
Hevristični preiskovalni algoritmi Preiskovanje
Hevristični preiskovalni algoritmi Hevristične ocene
Hevristični preiskovalni algoritmi Ocene prenesemo proti trenutnemu stanju
Hevristični preiskovalni algoritmi Naredimo potezo
Patologija Globlje preiskovanje da slabše odločitve ...
Patologija ... kot plitvejše
Dve vrsti preiskovalnih algoritmov • Minimaks • Igre z dvema igralcema • Enoagentno preiskovanje • Iskanje poti po zemljevidu • ...
Primer patologije Trenutni položaj Prava poteza 5 6 Drevo igre Prave vrednosti 7 5 6 9 7 4 5 3 1 6 9 8
Primer patologije 5 6 Hevristične ocene 7 5 6 9 8/7 2/4 6/5 3/3 2/1 4/6 9/9 6/8
Primer patologije 5 6 Maks 8/7 6/5 4/6 9/9 8/7 2/4 6/5 3/3 2/1 4/6 9/9 6/8
Primer patologije Min 6/5 4/6 8/7 6/5 4/6 9/9 8/7 2/4 6/5 3/3 2/1 4/6 9/9 6/8
Primer patologije Izbrana poteza 6/5 4/6 8/7 6/5 4/6 9/9 8/7 2/4 6/5 3/3 2/1 4/6 9/9 6/8
Primer patologije Hevristične ocene 6/5 4/6 4/5 6/6 7 5 6 9 7 4 5 3 1 6 9 8
Primer patologije Izbrana poteza 6/5 4/6 4/5 6/6 7 5 6 9 7 4 5 3 1 6 9 8
Primer patologije 6/5 4/6 4/5 6/6 Večja globina preiskovanja (3) Manjša globina preiskovanja (1)
Primer patologije 6/5 4/6 4/5 6/6 Večja hevristična napaka (1, 2) Manjša hevristična napaka (1, 0) Večja globina preiskovanja (3) Manjša globina preiskovanja (1)
Primer patologije Napačna poteza Prava poteza 6/5 4/6 4/5 6/6 Večja hevristična napaka (1, 2) Manjša hevristična napaka (1, 0) Večja globina preiskovanja (3) Manjša globina preiskovanja (1)
Pretekla opažanja patologije Nau [1979], Beal [1980], Bratko & Gams [1982], Pearl [1983] ... Bealov model: • konstantna vejitev drevesa igre • dve vrednosti – poraz, zmaga • verjetnost poraza se z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine Zdi se realističen, a je patološki – realnost pa ni patološka
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • dve vrednosti – poraz, zmaga • verjetnost poraza se z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • dve vrednosti – poraz, zmaga • verjetnost poraza se z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • realne vrednosti • verjetnost poraza se z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine V dobljenih položajih pot proti zmagi V izgubljenih položajih verjetnost poraza Programi delajo tako
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • realne vrednosti • po pretvorbi v dve vrednosti se verjetnost poraza z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • realne vrednosti • po pretvorbi v dve vrednosti se verjetnost poraza z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot verjetnost, da se poraz in zmaga zamenjata – neodvisna od globine
Realnovrednostni minimaks Naš model: • konstantna vejitev drevesa igre • realne vrednosti • po pretvorbi v dve vrednosti se verjetnost poraza z nivoja na nivo ohranja • vrednosti vozlišč znotraj nivoja neodvisne • statična hevristična napaka – predstavljena kot Gaussov šum – neodvisna od globine
Merjenje patološkosti Merimo napako v korenu Drevo igre Preiskujemo do različnih globin Konstantna statična hevristična napaka
Merjenje patološkosti Napaka v korenu z globino narašča: patologija Drevo igre Napaka v korenu z globino pada: normalno
Napaka v korenu Naš model normalen Bealov model patološki
Naš model pove Konstantna realnovrednostna statična hevristična napaka odpravi patologijo Pretekle razlage manj enostavne, postavljale dodatne pogoje [Scheucher & Kaindl 1998]
Posplošitev Konstantna realnovrednostna statična hevristična napaka odpravi patologijo Matematično dokazali, da to velja v drevesih igre z neodvisnimi vrednostmi sosednjih vozlišč nasploh
Posplošitev Konstantna realnovrednostna statična hevristična napaka odpravi patologijo Matematično dokazali, da to velja v drevesih igre z neodvisnimi vrednostmi sosednjih vozlišč nasploh
Zakaj je minimaks koristen Hevristične vrednosti Prave vrednosti
Zakaj je minimaks koristen Širši krivulji: večja varianca Ožja krivulja: manjša varianca
Zakaj je minimaks koristen Vsak nivo preiskovanja: • zmanjša varianco • hevristične vrednosti približa pravim • zmanjša napako
Zakaj je minimaks koristen Prava vrednost starša
Zakaj je minimaks koristen Večji brat prevelik Manjši brat prevelik
Zakaj je minimaks koristen Manjši brat prevelik – škoduje
Zakaj je minimaks koristen Večji brat premajhen Manjši brat večji od večjega
Zakaj je minimaks koristen Manjši brat večji od večjega - koristi
Zakaj je minimaks koristen Koristni učinek manjšega brata večji od škodljivega
Zakaj je minimaks koristen Razlaga koristnosti minimaksa
Dejavniki, ki vplivajo na patologijo • Število vrednosti položajev – zrnatost • Vejitev drevesa igre • Odvisnost sosednjih vozlišč
Zrnatost Na nivoju 5 je več vozlišč z vrednostjo 1 Na nivoju 5 je manj vozlišč z vrednostjo 2
Zrnatost Od tod podobno zrnatosti 2
Zrnatost Maksimumi oklestijo majhne vrednosti Minimumi oklestijo velike vrednosti
Zrnatost Na vrhu podobno zrnatosti 2
Zrnatost Do konca zastopanih več vrednosti