230 likes | 384 Views
Wstęp do Teorii Gier. Dzielenie ciastka. Handlowanie z sekwencyjnymi ofertami ( alternating offers bargaining ). Dwóch graczy, Adam i Bartek negocjują ile kto dostanie ciastka wielkości 1 W czasie 0, Adaś składa Bartkowi ofertę Jeśli Bartek zaakceptuje, Adaś dostanie , a Bartek
E N D
Handlowanie z sekwencyjnymi ofertami (alternatingoffersbargaining) • Dwóch graczy, Adam i Bartek negocjują ile kto dostanie ciastka wielkości 1 • W czasie 0, Adaś składa Bartkowi ofertę • Jeśli Bartek zaakceptuje, Adaś dostanie , a Bartek • Jeśli Bartek odrzuci, wtedy: • W czasie 1, Bartek składa Adasiowi ofertę • Jeśli Adaś zaakceptuje, Bartek otrzymuje , a Adaś • Jeśli Adaś odrzuci, musi złożyć następną ofertę w czasie 2 • Proces trwa dopóki któryś z nich nie zaakceptuje • Ponieważ chłopcy są niecierpliwi, okresowe dyskonto wynosi
Stacjonarna równowaga bez opóźnień • Bez opóźnień – wszystkie oferty równowagi są zaakceptowane • Stacjonarne – Oferty równowagi nie zależą od czasu Niech będzie ofertami równowagi • Co Bartek oczekuje dostać jeśli odrzuci ofertę Adasia? • A zatem w równowadze: • I podobnie dla Adama:
Stacjonarna równowaga bez opóźnień • Istnieje góra jedna równowaga stacjonarna bez opóźnień • Trzeba jeszcze udowodnić, że w ogóle istnieje taka równowaga • Rozważmy następujące strategie: • Gracz A: Zawsze zaoferuj , zaakceptuj każdą jeśli • Gracz B: Zawsze zaoferuj , zaakceptuj każdą jesli
Stacjonarna równowaga bez opóźnień • Jednorazowe odstępstwo - one-shotdeviation- od strategii s w podgrze jest strategią, która różni się od s tylko jedną akcją dla początkowego wierzchołka tej podgry • Zasada jednorazowego odstępstwa – one-deviation property – profil strategii jest SPNE wtedy i tylko wtedy, gdy żaden z graczy nie posiada zyskownego dla siebie jednorazowego odstępstwa w żadnej podgrze: • Zasada ta zachodzi dla gier nieskończonych jeśli spełnione są pewne warunki • Na szczęście te warunki spełnione są przez naszą grę
Stacjonarna równowaga bez opóźnień • Udowodnimy, że poniższy profil strategii jest SPNE: • Trzeba pokazać, że żaden gracz nie ma zyskownego jednorazowego odstępstwa w żadnej podgrze • Podgry zaczynające się od oferty Adasia: • Jeśli Adaś zaoferuje • Bartek zaakceptuje • Ale Adasia wypłata będzie niższa niż w równowadze • Jeśli Adaś zaoferuje • Bartek odrzuci i zaoferuje • Adaś zaakceptuje, ale jego wypłata będzie mniejsza
Stacjonarna równowaga bez opóźnień • Podgry zaczynające się od Adasia odpowiadającego na oferty Bartka: • Jeśli Adaś odrzuci ofertę • On zaoferuje i jego wypłata będzie • Jeśli Adaś zaakceptuje ofertę • Wtedy też nie jest to opłacalne • Podobnie strategia Bartka jest optymalna w każdej podgrze • Zatem udowodniliśmy, że profil strategii jest SPNE
Stacjonarna równowaga bez opóźnień • Ariel Rubinstein (1982) pokazał, że to jest jedyna równowaga doskonała w podgrach (SPNE) jeśli chłopcy są niecierpliwi (choćby minimalnie) • Ta równowaga jest również efektywna • Siła negocjacyjna (bargainingpower) • Kawałek dla Adasia • Kawałek dla Bartka • Kto bardziej cierpliwy, ten więcej dostanie • A co jeśli są jednakowo cierpliwi? • Korzyść pierwszego, ale ona znika dla
Prisoners’ dilemma – how to getcooperation? Nashequilibrium Pareto optimum Equivalent to: WhereT>R>U>S and R≥(S+T)/2 R – reward, S – sucker, T – temptation, U - uncooperative Goal: getcooperation
Get cooperationinprisoners’ dilemma • Threeways: • Iteratedgame • Meta-game • Experiments
1 – Iteratedgame • In most realsituations, thegameisplayed many times • Suppose we play thegame N times: • Domino effect: solve by backwardinduction • Twoways to overcome domino effects: • Real playersrarelyconform to strictrationality • We don’tknowhow many games we are gonna play • Suppose, p istheprobability of nextiteration. We play the first gamewithprobability 1, thenextwithprobability p, thesecondnextwithprobability p2, etc.
1 – Iteratedgame • Grim triggerstrategy (GTS): • Play C inthe first game • Ifyouropponentplayed C alwaysbefore, play C • Ifyouropponneteverdeviatedinthe past, play D • Supposethat my opponentplays GTS. • If I play always C, I will get • If I play first m times C and then D, I will get
1 – Iteratedgame • So I shouldnever play D, if for any m: • Whichisequivalent to: • Example
2 – Meta-game • 1 Level: MrsColumnmakesherdecision dependent on herexpectation of whatstrategy will Mr Raw choose • Choose A independent on herexpectationaboutMrRaw’sstrategy • Choosethe same strategy as sheexpectsMr Raw to use • Choosetheoppositestrategy to whatsheexpectsaboutMrRaw’sstrategy • Choose B independent on herexpectationaboutMrRaw’sstrategy
2 – Meta-game 2 Level: Mr Raw decision dependent on his predictionsaboutMrsColumn’sstrategy: • 16 strategiese.g. AAAA – always play A; ABAB – play B ifyourpredictionisthatMrsColumnusesstrategy AB or BB, otherwise play A Mr Raw BABB – Cooperateif and onlyifyouareconvincedthatyouropponent will cooperateif and onlyifyou will cooperate (thisstrategyweaklydominatesalltheothers) MrsColumn AB – Cooperateif and onlyifyouareconvincedthatyouropponent will cooperate
3 Sposób – praktyka i Wet za wet Robert Axelrod przeprowadził eksperyment w 1984 roku: Specjaliści mieli napisać programy implementujące jakąś strategię – 14 programów Zwycięzca – Anatol Rapoport strategia Tit for Tat czyli wet za wet Axelrod opublikował wyniki i podał programy, które zwalczają Tit for Tat W drugiej rundzie udział wzięło 62 specjalistów .... i znowu wygrał Rapoport z niezmienionym programem
Wet za wet – Tit for tat Wet za wet: W pierwszej partii zagraj NZ W każdej następnej zagraj to, co Twój przeciwnik zagrał poprzednim razem 4 właściwości dobrej strategii: Przyjazna – zaczyna od kooperacji i nie zdradza jako pierwsza Odwetowa – powinna zdecydowanie karać zdradę Przebaczająca – po ukaraniu powinna być skłonna do dalszej kooperacji Przejrzysta – jej decyzje spójne i łatwe do przewidzenia
Uproszczony poker • Jaś i Małgosia pod nieobecność baby jagi grają w karty w domku na kurzej łapce: • Oboje kładą 1 cukierka na stół • Z talii złożonej tylko z asów i króli losują po jednej karcie • Jasiu może podbić stawkę o 2 cukierki lub spasować • Jeśli spasuje Małgosia zabiera cukierki ze stołu • Jeśli podbije, wówczas Małgosia może sprawdzić lub spasować • Jeśli spasuje, Jasiu zabiera całą stawkę • Jeśli sprawdzi, wówczas porównują karty i wyższa wygrywa, w przypadku remisu dzielą stawkę po równo.
Równoważna postać strategiczna • Jasiu podbija… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy • Małgosia sprawdza… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy
Równoważna postać strategiczna • Jasiu podbija… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy • Małgosia sprawdza… • 11 zawsze • 12 tylko gdy ma asa • 21 tylko gdy ma króla • 22 nigdy Dwie równowagi Nasha, dwa punkty siodłowe