1 / 23

Wstęp do Teorii Gier

Wstęp do Teorii Gier. Dzielenie ciastka. Handlowanie z sekwencyjnymi ofertami ( alternating offers bargaining ). Dwóch graczy, Adam i Bartek negocjują ile kto dostanie ciastka wielkości 1 W czasie 0, Adaś składa Bartkowi ofertę Jeśli Bartek zaakceptuje, Adaś dostanie , a Bartek

jafari
Download Presentation

Wstęp do Teorii Gier

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Wstęp do TeoriiGier

  2. Dzielenie ciastka

  3. Handlowanie z sekwencyjnymi ofertami (alternatingoffersbargaining) • Dwóch graczy, Adam i Bartek negocjują ile kto dostanie ciastka wielkości 1 • W czasie 0, Adaś składa Bartkowi ofertę • Jeśli Bartek zaakceptuje, Adaś dostanie , a Bartek • Jeśli Bartek odrzuci, wtedy: • W czasie 1, Bartek składa Adasiowi ofertę • Jeśli Adaś zaakceptuje, Bartek otrzymuje , a Adaś • Jeśli Adaś odrzuci, musi złożyć następną ofertę w czasie 2 • Proces trwa dopóki któryś z nich nie zaakceptuje • Ponieważ chłopcy są niecierpliwi, okresowe dyskonto wynosi

  4. Stacjonarna równowaga bez opóźnień • Bez opóźnień – wszystkie oferty równowagi są zaakceptowane • Stacjonarne – Oferty równowagi nie zależą od czasu Niech będzie ofertami równowagi • Co Bartek oczekuje dostać jeśli odrzuci ofertę Adasia? • A zatem w równowadze: • I podobnie dla Adama:

  5. Niecierpliwość czy naturalne prawa natury?

  6. Stacjonarna równowaga bez opóźnień • Istnieje góra jedna równowaga stacjonarna bez opóźnień • Trzeba jeszcze udowodnić, że w ogóle istnieje taka równowaga • Rozważmy następujące strategie: • Gracz A: Zawsze zaoferuj , zaakceptuj każdą jeśli • Gracz B: Zawsze zaoferuj , zaakceptuj każdą jesli

  7. Stacjonarna równowaga bez opóźnień • Jednorazowe odstępstwo - one-shotdeviation- od strategii s w podgrze jest strategią, która różni się od s tylko jedną akcją dla początkowego wierzchołka tej podgry • Zasada jednorazowego odstępstwa – one-deviation property – profil strategii jest SPNE wtedy i tylko wtedy, gdy żaden z graczy nie posiada zyskownego dla siebie jednorazowego odstępstwa w żadnej podgrze: • Zasada ta zachodzi dla gier nieskończonych jeśli spełnione są pewne warunki • Na szczęście te warunki spełnione są przez naszą grę

  8. Stacjonarna równowaga bez opóźnień • Udowodnimy, że poniższy profil strategii jest SPNE: • Trzeba pokazać, że żaden gracz nie ma zyskownego jednorazowego odstępstwa w żadnej podgrze • Podgry zaczynające się od oferty Adasia: • Jeśli Adaś zaoferuje • Bartek zaakceptuje • Ale Adasia wypłata będzie niższa niż w równowadze • Jeśli Adaś zaoferuje • Bartek odrzuci i zaoferuje • Adaś zaakceptuje, ale jego wypłata będzie mniejsza

  9. Stacjonarna równowaga bez opóźnień • Podgry zaczynające się od Adasia odpowiadającego na oferty Bartka: • Jeśli Adaś odrzuci ofertę • On zaoferuje i jego wypłata będzie • Jeśli Adaś zaakceptuje ofertę • Wtedy też nie jest to opłacalne • Podobnie strategia Bartka jest optymalna w każdej podgrze • Zatem udowodniliśmy, że profil strategii jest SPNE

  10. Stacjonarna równowaga bez opóźnień • Ariel Rubinstein (1982) pokazał, że to jest jedyna równowaga doskonała w podgrach (SPNE) jeśli chłopcy są niecierpliwi (choćby minimalnie) • Ta równowaga jest również efektywna • Siła negocjacyjna (bargainingpower) • Kawałek dla Adasia • Kawałek dla Bartka • Kto bardziej cierpliwy, ten więcej dostanie • A co jeśli są jednakowo cierpliwi? • Korzyść pierwszego, ale ona znika dla

  11. Prisoners’ dilemma – how to getcooperation? Nashequilibrium Pareto optimum Equivalent to: WhereT>R>U>S and R≥(S+T)/2 R – reward, S – sucker, T – temptation, U - uncooperative Goal: getcooperation

  12. Get cooperationinprisoners’ dilemma • Threeways: • Iteratedgame • Meta-game • Experiments

  13. 1 – Iteratedgame • In most realsituations, thegameisplayed many times • Suppose we play thegame N times: • Domino effect: solve by backwardinduction • Twoways to overcome domino effects: • Real playersrarelyconform to strictrationality • We don’tknowhow many games we are gonna play • Suppose, p istheprobability of nextiteration. We play the first gamewithprobability 1, thenextwithprobability p, thesecondnextwithprobability p2, etc.

  14. 1 – Iteratedgame • Grim triggerstrategy (GTS): • Play C inthe first game • Ifyouropponentplayed C alwaysbefore, play C • Ifyouropponneteverdeviatedinthe past, play D • Supposethat my opponentplays GTS. • If I play always C, I will get • If I play first m times C and then D, I will get

  15. 1 – Iteratedgame • So I shouldnever play D, if for any m: • Whichisequivalent to: • Example

  16. 2 – Meta-game • 1 Level: MrsColumnmakesherdecision dependent on herexpectation of whatstrategy will Mr Raw choose • Choose A independent on herexpectationaboutMrRaw’sstrategy • Choosethe same strategy as sheexpectsMr Raw to use • Choosetheoppositestrategy to whatsheexpectsaboutMrRaw’sstrategy • Choose B independent on herexpectationaboutMrRaw’sstrategy

  17. 2 – Meta-game 2 Level: Mr Raw decision dependent on his predictionsaboutMrsColumn’sstrategy: • 16 strategiese.g. AAAA – always play A; ABAB – play B ifyourpredictionisthatMrsColumnusesstrategy AB or BB, otherwise play A Mr Raw BABB – Cooperateif and onlyifyouareconvincedthatyouropponent will cooperateif and onlyifyou will cooperate (thisstrategyweaklydominatesalltheothers) MrsColumn AB – Cooperateif and onlyifyouareconvincedthatyouropponent will cooperate

  18. 3 Sposób – praktyka i Wet za wet Robert Axelrod przeprowadził eksperyment w 1984 roku: Specjaliści mieli napisać programy implementujące jakąś strategię – 14 programów Zwycięzca – Anatol Rapoport strategia Tit for Tat czyli wet za wet Axelrod opublikował wyniki i podał programy, które zwalczają Tit for Tat W drugiej rundzie udział wzięło 62 specjalistów .... i znowu wygrał Rapoport z niezmienionym programem

  19. Wet za wet – Tit for tat Wet za wet: W pierwszej partii zagraj NZ W każdej następnej zagraj to, co Twój przeciwnik zagrał poprzednim razem 4 właściwości dobrej strategii: Przyjazna – zaczyna od kooperacji i nie zdradza jako pierwsza Odwetowa – powinna zdecydowanie karać zdradę Przebaczająca – po ukaraniu powinna być skłonna do dalszej kooperacji Przejrzysta – jej decyzje spójne i łatwe do przewidzenia

  20. Uproszczony poker • Jaś i Małgosia pod nieobecność baby jagi grają w karty w domku na kurzej łapce: • Oboje kładą 1 cukierka na stół • Z talii złożonej tylko z asów i króli losują po jednej karcie • Jasiu może podbić stawkę o 2 cukierki lub spasować • Jeśli spasuje Małgosia zabiera cukierki ze stołu • Jeśli podbije, wówczas Małgosia może sprawdzić lub spasować • Jeśli spasuje, Jasiu zabiera całą stawkę • Jeśli sprawdzi, wówczas porównują karty i wyższa wygrywa, w przypadku remisu dzielą stawkę po równo.

  21. Równoważna postać strategiczna • Jasiu podbija… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy • Małgosia sprawdza… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy

  22. Równoważna postać strategiczna • Jasiu podbija… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy • Małgosia sprawdza… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy Dwie równowagi Nasha, dwa punkty siodłowe

More Related