1 / 12

Vězňovo dilema a evolučně stabilní strategie

VŠFS 3.3.2010 Tomáš Kosička. Vězňovo dilema a evolučně stabilní strategie. Základní popis VD. Zřejmě nejznámějším příkladem z teorie her je tzv, „věznovo dilema“ Stručný popis:

jenski
Download Presentation

Vězňovo dilema a evolučně stabilní strategie

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. VŠFS 3.3.2010 Tomáš Kosička Vězňovo dilema a evolučně stabilní strategie

  2. Základní popis VD • Zřejmě nejznámějším příkladem z teorie her je tzv, „věznovo dilema“ • Stručný popis: • Policie zadržela dva podezřelé – Adama a Boba – a drží je odděleně. Důkazy, které má policie, nejsou dostatečné pro usvědčení, takže se musí spoléhat na přiznání resp. udání. • Pokud se oba dva navzájem udají, budou odsouzeni na pět let. • Pokud jeden udá druhého a druhý zůstane mlčet, bude udavač volný a druhý odsouzen na plných dvacet let. • Pokud oba dva zůstanou mlčet, odsoudí oba za drobnější přestupky na jeden rok. • Vzhledem k tomu, že ani jeden zadržený si nemůže být jistý, co zvolí ten druhý, nastává dilema: mluvit nebo mlčet?

  3. Ve vězňově dilematu mají oba hráči dvě možnosti – spolupracovat nebo zradit. Sobecká volba zradit vede k vyššímu zisku než spolupráce, pokud druhý hráč spolupracovat chtěl, ale k nižšímu, pokud také zradil. Racionálním chováním obou obviněných je udat svého spolupachatele, i když optimálním řešením je mlčení obou. Rozpor mezi Nashovou rovnováhou a Paretovským optimem. Tento výsledek, kdy zrada je tím správným rozhodnutím, vedl k mnoha diskuzím a pokusům o vysvětlení. Také bylo provedeno několik široce publikovaných experimentů. Zrada kooperace neznamé rozhodnutí Shafir, Tversky (92) 97 84 63 Li, Taplan (02) 83 66 60 Busemeyer (06) 91 84 66 (čísla jsou procentuálním vyjádřením zrady, vynechal jsem Croson (99) ) Kvantování VD – 2 druhy – matematický pomocí unitárních transformací a popis systému vlnovou funkcí Další experimenty ukázaly, že ochota zradit či kooperovat je do velké míry ovlivněna velikostí odměny (trestu) Rozpory teorie s experimenty

  4. (Axelrod 1984) podmínka T>R>P>S R odměna za spolupráci obou P odměna za zradu obou T odměna za zradu jednoho S „odměna“ za osamocenou spolupráci Obecná forma vězňova dilematu

  5. (uvádím je čátečný výčet spíše pro ilustraci) i1 – Index soupeřivé výhody i1= S-T Při růstu i1 se zvyšuje ochota spolupráce, na zakladě experimentů Rapoport popsal i1= F(ω) , kde ω je procentuální úroven kooperace i2 – Index průměrné výhody soupeření i2 = (S+P)/2 – (R+T)/2 růst i2 – pokles spolupráce i3 – Index průměrné výhry v jedné hře i3=(T+R+S+P)/4 růst i3 – pokles spolupráce (nepotvrzeno experimentálně) δ1,δ2- Index poměrů hodnot dvou dvojic δ1 = (R-P)/(T-S) δ2= (R-S)/(T-S) roste–li δ1,δ2 stoupá úroven kooperace i4 – Index poměru sil pro volbu C a D i4= sqrt(T/(R-P)) Zajímavost – tento index má průběh blížící se užitkové funkci i5 – Index logaritmického poměru rozdílů i5 = ln ((T-S)/(R-P)) zřejmě nejpopisnější – čím vyšší je zisk ze spolupráce v poměru k tomu, co se stane při oboustranném soupeření, tím je vyšší úroveň kooperace. Zároven platí, že podmínky spolupráce se výrazně zlepší snížením rozdílu mezi T a S. G - Index altruismu, který vyjadřuje úroven hráčova uspokojení ze soupeřovy (partnerovy) výhry Indexy „krutosti“ výplatní matice:

  6. Je stále zrada dominantní strategií? Různé strategie: Statické (nepodmíněné a podmíněné) a dynamické (diskrétní a kontinuální) DDS – jednofázová – statická strategie, dvoufázová – předehra + interakce, třífázová – předehra, mezihra, interakce Pro zajímavost srovnání (pokus na lidech) Strategie napraveného hříšníka (100D,100C, 7+TFT) a padlého světce (100C, 4+ TFT) (DDS) 47vs32% Opakované vězňovo dilema

  7. Axelroduv turnaj: matice 5,3,1,0, 15 strategií, 200 kol Velký vliv úvodního „tahu“ Zajímavost – prvních 8 programů zahajuje spoluprací. Evoluce spolupráce

  8. Jiný způsob hodnocení - „fotbalová tabulka“

  9. Definice stabilní strategie: Strategie je evolučně stabilní, pokud populace jedinců užívajících tuto strategii nemůže být napadena řídce se vyskytující odlišnou mutantní strategií. V případě jednokolového Věznova dilematu nemůže žádná strategie napadnout „Vždy zradit“ V realitě dochází v mnoha případech ovšem k opakovanému setkání dvou jedinců (hráčů), přecházíme k opakovanému VD, kdy může hráč využít různé strategie a zkušeností z minulého setkání Konflikt s realitou - Známý vs. Neznámý počet setkání

  10. Děkuji za pozornost

More Related