1 / 26

Jak poznáme, že máme spolupracovat ?

Jak poznáme, že máme spolupracovat ?. Seminář ČSKI, DAR a odd. AS Milan Mareš 20. říina 2009. Kde se vzala teorie her. 1944 – John von Neumann, Oscar Morgenstern: Theory of Games and Economic Behaviour. ────────────────

pillan
Download Presentation

Jak poznáme, že máme spolupracovat ?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Jak poznáme, že máme spolupracovat ? Seminář ČSKI, DAR a odd. AS Milan Mareš 20. říina 2009.

  2. Kde se vzala teorie her 1944 –John von Neumann, Oscar Morgenstern: Theory of Games and Economic Behaviour. ──────────────── Už první tvůrci počtu pravděpodobnosti, Girolamo Cardano a Blaise Pascal s Pierrem de Fermat se inspirovali hazardními hrami. Von Neumannova a Morgensternova kniha má 2 části: o nekooperativních (strategických) hrách a o kooperativních (koaličních) hrách.

  3. To nejzákladnější o strategických hrách Omezíme se na hry dvou hráčů Množina hráčů {1,2} Strategie hráčů mohou být ryzí (= reálné tahy) a smíšené (= rozložení pravděpodobností nad množinami ryzích strategií). Množiny strategií : Ryzí strategie - R1 , R2 Smíšené strategie - S1 , S2 Výherní funkce hráčů p1 , p2 , pi : S1  S2  R, i{1,2} pi(s1 , s2) je výhra hráčei {1,2}, pokud hráč1 zvolil strategii s1S1 a hráč2 zvolil s2S2 .

  4. Výhry hráčů Pro i∈{1,2},s1S1 a s2S2, R1={r1(1), … , rk(1)}, R2 ={r1(2), … , rl(2)}, pi(s1 , s2)= =Σi=1,…,k, j=1,…,l pi(ri(1),rj(2))·s1(ri(1))· s2(rj(2)), kde s1(ri(1))as2(rj(2)), jsou pravděpodobnosti.

  5. Popis výher Výhry hráčů pak můžeme popsat dvěma maticemi, Π1 a Π2 , jejichž políčka jsou hodnoty p1(ri(1),rj(2)) a p2 (ri(1),rj(2)). Každá z nich uvádí výhry příslušného hráče. Nebo můžeme výhry hráčů zobrazit graficky jako oblast ve dvojrozměrném prostoru se souřadnicemi p1 a p2 . Oblast je ohraničená a uzavřená, každý bod v ní odpovídá některé dvojici výher (p1(s1 , s2),p2(s1 , s2)) a je podmnožinou konvexního obalu bodů o souřadnicích (p1 (ri(1),rj(2)),p2(ri(1),rj(2))).

  6. *** Každý bod uvnitř oblasti obsahuje jednu dvojici výher pro každého z hráčů. Hvězdičky označují vektory výher pro dvojice ryzích strategií. Oblast může být menší než jejich konvexní obal. Graf pro hry, kde hráč 1 má 2 ryzí strategie a hráč 2 má 3 ryzí strategie p2 (p1(ri(1),rj(2)), p2(ri(1),rj(2))) (p1(s1,s2),p2(s1,s2)) p1

  7. Matice pro hru, kde každý hráč má 2 ryzí strategie

  8. Nejznámější řešení strategické hry Garanční (minimaxové) řešení: dvojice strategií (s‘1 ,s‘2) ∈S1S2, taková, že p1(s‘1 ,s‘2) = max[min(p1 (s1,s2):s2∈ S2): s1∈ S1], p2(s‘1 ,s‘2) = max[min(p2 (s1,s2):s1∈ S1): s2∈ S2] (J. von Neumann, O. Morgenstern). Rovnovážné řešení: dvojice (s*1 ,s*2)∈S1S2, taková, že ∀(s1∈S1): p1(s*1 ,s*2) ≥p1(s1 ,s*2), ∀(s2∈S2): p2(s*1 ,s*2) ≥p2(s*1 ,s2), (J. von Neumann, O. Morgenstern, J. F. Nash).

  9. Hodnota hry pro hráče Při zachování dosavadního značení nazveme čísla v(1)= p1(s‘1 ,s‘2)a v(2)= p2(s‘1 ,s‘2) (hodnoty výher obou hráčů při uplatnění garančních strategií) hodnotami hry pro hráče 1 a pro hráče 2. Strategie s‘1 a s‘2 nazýváme garančními strategiemi hráčů. Hodnoty hry představují zaručenou výhru každého hráče, pokud se bude chovat dostatečně „rozumně“ a zabezpečí se svou garanční strategií proti jakémukoliv chování protivníka.

  10. Slavný příklad: DILEMA VĚZNĚ:ryzí strategie – r1= Přiznat, r2 = Nepřiznat

  11. *** Garanční i rovnovážné řešení je(P,P), i když se intuitivně jeví jako nesmyslné. Je ale jediné stabilní – žádný hráč je nemůže jednostranně zlepšit a zabezpečuje každého z hráčů proti všem možným akcím protihráče. Spolupráce není možná DILEMA VĚZNĚ - Graf výher p1 0 0 (N,P) (N,N) (P,P) v(1)= -12 v(2)= -12 p2 (P,N)

  12. Jináúloha: PARTNERSKÝ SPOR ryzí strategie – r1= Kino, r2 = Fotbal

  13. *** Garanční řešení je (F,K), rovnovážná řešení jsou dvě, (K,K) a (F,F). Garanční řešení sice zaručuje, že „se nic horšího nemůže stát“, je ale značně neuspokojivé. PARTNERSKÝ SPOR – Graf výher pONA v(1)= 5 v(2)= 5 (K,K) (F,F) (F,K) (K,F) pON 0

  14. Jsou nabízená řešenírozumná? Pokud se nemohou oba partneři domluvit, budou se nejspíš chovat garančně a může se stát, že půjdou každý jinam (a dokonce každý tam, kam nechtěl). Je proto v jejich zájmu, vybrat nějak (třeba i náhodně) jenom mezi rovnovážnými možnostmi(K,K) a (F,F). Jinými slovy, mezi vektory výher (5,10) a (10,5). To ale bez dohody nejde!

  15. Rozumné dohody mohou být jenom ty, jejichž „výhry“ leží na čárkované spojnici. Například náhodný pokus s pravděpodobnostmiP(K,K)aP(F,F)(třeba½, ½) – s výsledkem označeným zeleně. To ale už není dvojice strategií jednotlivých hráčů, ale společná strategie koalice. *** Cesta k dohodě pONA (K,K) (F,F) (F,K) pON

  16. Koaliční (kooperativní) hra Množina hráčů: I , Koalice: K⊂I. Z hlediska každé koalice K≠∅ se hra stává hrou dvou hráčů: K, a I–K , pro které je možné pomocí garančního řešení odvodit jejich hodnotu hry v. Hodnota hry pro koalici K⊂I, K≠∅, je v(K). Kromě toho se definuje v(∅)=0. Kooperativní hra - (I,v)

  17. Důležité typy kooperativních her Kooperativní hra (I,v) je: Superaditivní, jestliže ∀(K,L⊂I): K∩L=∅ ⇒ v(K⋃L) ≥ v(K)+v(L). Subaditivní, jestliže ∀(K,L⊂I): K∩L=∅ ⇒ v(K⋃L) ≤ v(K)+v(L). Aditivní, jestliže ∀(K,L⊂I): K∩L=∅ ⇒ v(K⋃L) = v(K)+v(L). Konvexní, jestliže ∀(K,L⊂I): v(K⋃L)+v(K∩L) ≥ v(K)+v(L).

  18. Řešení kooperativní hry – jádro hry Označme #I = n. Reálný vektor x=(xi)i∈I∈Rnnazveme podílovým vektorem, jestliže Σi∈Ixi ≤ v(I) . (Množina všech hráčů ho může uskutečnit.) Jádro hry je množina reálných vektorů C(I,v) = {x=(xi)i∈I∈Rn: Σi∈Ixi ≤ v(I) a ∀(K⊂I): Σi∈Kxi ≥v(K)}. (Je to množina všech podílových vektorů, proti kterým nemůže vznést účinné námitky žádná koalice.)

  19. Vlastnosti jádra hry Jen ty hlavní: • Nemusí být nutně neprázdné. • Pokud je neprázdné, je to konvexní a uzavřená podmnožina Rn . • Pro konvexní hry je vždy neprázdné (ale nemusí tomu být naopak – např. I={1,2,3}v(I)=6, v(i,j)=4, v(i)=1). • Existuje nutná a postačující podmínka pro neprázdnost jádra.

  20. Kdy může vzniknout spolupráce ? K tomu, aby hráči byli ochotni uzavřít koalici, je potřeba splnit dvě podmínky: • Musí hráčům nabídnout takový podíl na výhře, aby jim žádná odštěpená koalice nemohla nabídnout víc. • Taková nabídka musí být splnitelná. To ale má dva háčky: • Hráči musí mít realistickou představu o očekávaných výhrách koalic (hodnotách v(K)). • Nabízené rozdělení výhry mezi hráče jim musí připadat alespoň přijatelně „spravedlivé“. Na druhou podmínku se podíváme blíž.

  21. Hodnota koaliční hry pro hráče Pokud je jádro neprázdné, bývá jen málokdy jednoprvkové. Každý z jeho vektorů je pro všechny hráče lepší (nebo není horší) než nespolupracovat vůbec. Přesto mají hráči zcela odlišné představy, který z nich je „spravedlivý“. Je tedy nutná existence nějakého kompromisu. Výsledkem je vektor s=(si)i∈I ∈Rn, který stanovuje „kompromisní“ podíl každého hráče. Nazývá se hodnota koaliční hry.

  22. Jaké vlastnosti má mít hodnota koaliční hry • Hodnoty sijsou nezávislé na pořadí, ve kterém jsou počítány. • Vektor sje podílovým vektorem. • Nechť (I,v) a (I,w) jsou dvě kooperativní hry hrané stejnou množinou hráčů, a nechť s∈Rn , t∈Rn jsou vektory jejich hodnot. Kooperativní hra (I,(v+w)), kde ∀(K⊂I): (v+w)(K)=v(K)+v(K), má vektor hodnot s+t=(si+ti)i∈I.

  23. Shapleyova hodnota hry R. Shapley dokázal, že existuje jediný vektor, který splňuje uvedené podmínky. Pro každého hráče i∈Ije definován vztahem si =ΣK⊂I,K≠∅[n!·(n-k)! / k!]·(v(K)-v(K-{i})). Shapleyova hodnota není jediný pokus o definování jednoznačného výsledku dohody koalice všech hráčů, díky splnění předchozích podmínek (a díky vlastnostem, které hned uvedeme) je nejuznávanější.

  24. Další vlastnosti Shapleyovy hodnoty • Pokud je jádro hry C(I,v)neprázdné, je Shapleyova hodnota jeho prvkem, s=(si )i∈I ∈C(I,v). Je vyváženým rozdělením zisku „podle zásluh“ (je to jakési těžiště jádra hry). • Pokud je C(I,v) prázdné, splňuje vektor Shapleyových hodnot spořád definiční požadavky (včetně toho, že je podílovým vektorem). Jen je „vyváženě nepřijatelný“ pro všechny hráče. Je tedy nejvhodnějším východiskem, pokud jsou hráči ke spolupráci nuceni.

  25. Poučení do života • Aby hráči správně rozhodli o spolupráci, musí mít dobrou představu o výhrách možných koalic (přitom vyjednávání probíhá před realizací hry a tedy dřív, než je znám skutečný výsledek). • K tomu, aby poznali výhodnost spolupráce před konfliktem, jim stačí znalost pravidel hry (množina hráčů, výherní funkce, případně množina přípustných koalic) a znalost vlastních preferencí. • Ke „spravedlivému“ rozdělení výhry už ale samotná pravidla hry nestačí. Musí existovat „soudce“ – buď osoba arbitra nebo respektované neosobní pravidlo typu Shapleyovy hodnoty. To už je něco navíc k pravidlům i k preferencím hráčů.

  26. Děkuji za výdrž Nějaké dotazy?

More Related