250 likes | 394 Views
SCHEMAT ARBITRAŻOWY NASHA I ROZWIĄZANIA KOOPERACYJNE. M.STAŃCZYK M. JÓZEFIAK A. MISZTAL.
E N D
SCHEMAT ARBITRAŻOWY NASHA I ROZWIĄZANIA KOOPERACYJNE M.STAŃCZYKM. JÓZEFIAKA. MISZTAL
W naszych dotychczasowych rozważaniach na temat gier o sumie niezerowej przyjmowaliśmy, że gracze nie próbują kooperować. Przyjmiemy teraz inne podejście. Nasi gracze uzgadniają między sobą jaki wynik w danej grze byłby uzasadniony (sprawiedliwy), oraz są gotowi zaakceptować uzgodniony wynik. Mogą również ustalić, że racjonalny i sprawiedliwy wynik będzie wskazany przez bezstronnego arbitra i jego decyzji się podporządkują. Jakimi regułami w takiej sytuacji powinni się kierować gracze lub arbiter? Czy można określić racjonalny, sprawiedliwy wynik? Rozpatrzmy następującą grę:
Jaki wynik byłby sprawiedliwy? Pierwszy pomysł, to wziąć wynik charakteryzujący się największą sumą wypłat, po czym podzielić tę sumę równo pomiędzy oboje graczy. W tej sytuacji Wiersz gra A, zaś Kolumna B i wypłacenie każdemu z graczy po 7,5. Tak wyznaczony wynik nazywamy rozwiązaniem egalitarnym. Jednak to rozwiązanie ma dwie istotne wady, na przykładzie których dobrze widać trudności, jakie trzeba pokonać, rozwiązując nasz problem.
Pierwsza wątpliwość bierze się stąd, że wypłaty w grze określone są w jednostkach użyteczności. Wartość sumy użyteczności nie może być interpretowana racjonalnie, zatem niemożliwe jest obliczanie i wybieranie największej „łącznej użyteczności” wyników gry. Użyteczności różnych graczy nie mogą być porównywane ani transferowane pomiędzy nimi, wiec nie możemy ich sumy podzielić pomiędzy graczy. Po drugie rozwiązanie egalitarne ignoruje asymetrię strategicznej pozycji obu graczy. Pozycja strategiczna Pani Kolumny jest bardzo mocna: strategia A dominuje B, więc naturalnym wynikiem gry jest B Wiersza –A Kolumny, co daje kolumnie najlepszy możliwy wynik.
Naszym zadaniem jest znalezienie takiej procedury arbitrażu, która nie zostawiłaby miejsca na nieuzasadnione manipulacje użytecznościami graczy, brałby pod uwagę zróżnicowanie ich pozycji strategicznych oraz odwoływała się do pojęcia sprawiedliwości. Jako pierwsi zajęli się tym problemem Neumann i Morgenstern, którzy ustalili, że dopuszczalne rozwiązania gry o sumie niezerowej muszą spełniać warunki: Optymalne w sensie Pareto: nie może być żadnego wyniku lepszego dla obu graczy, lub lepszy dla jednego, a nie gorszy dla drugiego. Wypłaty graczy nie powinny być niższe niż ich poziomy bezpieczeństwa. Gracza nie można zmusić do zaakceptowania rozwiązania, w którym jego wypłata jest niższa niż ta, którą może on sobie zagwarantować, grając niekooperacyjnie. Zbiór wyników spełniających oba powyższe kryteria nazywamy zbiorem negocjacyjnym.
W tej grze poziom bezpieczeństwa Wiersza wynosi , a Kolumny 6. Na wieloboku wypłat zbiorowi wyników paretooptymalnych odpowiada odcinek łączący punkty (4,8) i (10,5), a zbiorem negocjacyjnym jest odcinek łączący (4,8) i (8,6). W ten sposób ustalamy jedynie pewien przedział dopuszczalnych wyników. Czy znajdziemy w nim jeden najbardziej sprawiedliwy wynik? Rozwiązanie tego problemu, znany jako schemat arbitrażowy Nasha, zaproponował John Nash. Załóżmy, że możliwe wyniki gry tworzą zbiór na płaszczyźnie kartezjańskiej, gdzie współrzędne są określone przez użyteczności graczy. Pan Wiersz i Pani Kolumna, w drodze negocjacji chcą przyjąć jeden wynik z tego zbioru. Jeżeli negocjacje zakończą się fiaskiem wynikiem gry będzie pewien z góry ustalony wynik , zwany status quo.
Ogólna metoda rozwiązania tego problemu, nazwana schematem arbitrażowym, musi każdemu wypukłemu wielobokowi z określonym, należącym do niego status quo (SQ), przypisać jako rozwiązanie jeden punkt. Nash zaczął od podania czterech aksjomatów, które w jego opinii, muszą być spełnione przez każdy akceptowalny schemat arbitrażowy. AKSJOMAT 1. RACJONALNOŚĆ. Rozwiązanie powinno należeć do zbioru negocjacyjnego. AKSJOMAT 2. NIEZALEŻNOŚĆ OD PRZEKSZTAŁCEŃ LINIOWYCH. Jeżeli użyteczności wiersza lub kolumny zostaną przekształcone przez rosnącą funkcję liniową, również odpowiednia współrzędna rozwiązania powinna być przekształcona przez tą funkcję.
AKCJOMAT 3. SYMETRIA. Jeżeli wielobok możliwych wyników jest symetryczny względem prostej o równaniu y=x+a, przechodzącej przez punkt SQ, punkt rozwiązania powinien leżeć na tej linii. AKSJOMAT 4. NIEZALEŻNOŚĆ OD ALTERNATYW NIEZWIĄZANYCH. Załóżmy, że dla wieloboku wyników P, rozwiązaniem przy punkcie SQ jest punkt N. Załóżmy, że dla wieloboku Q, zawierającego się całkowicie w P, należą punkty SQ i N. W takim razie rozwiązanie N powinno być również rozwiązaniem dla wieloboku Q, jeśli jako punkt status quo utrzymany zostanie SQ.
Pierwsze trzy aksjomaty są dość oczywiste. Aksjomat 3 odwołuje się do idei sprawiedliwości jako symetrii czy też niedyskryminacji, w szczególnym przypadku całkowicie symetrycznej sytuacji graczy. Bardziej skomplikowany jest aksjomat 4. Argumentacja Nasha za jego przyjęciem była następująca: Załóżmy, że w sytuacji, gdy P jest zbiorem możliwych wyników, a SQ status quo, Wiersz i Kolumna zgodzili się na N jako na najsprawiedliwszy możliwy wynik. Dalej, wyobraźmy sobie, że pewne wyniki należące do P okazały się jednak nieosiągalne – w ten sposób zbiór możliwych wyników został ograniczony do Q. W takim razie, skoro N zostało ocenione jako rozwiązanie sprawiedliwsze od wszystkich innych wyników należących do P, to jest ono także sprawiedliwsze od wszystkich innych wyników należących do Q.
Jakie są konsekwencje przyjęcia aksjomatu 4? Rozpatrzmy przedstawiony przykład: Niech N będzie rozwiązaniem problemu arbitrażowego (EAC, SQ). Zgodnie z aksjomatem 4 powinien być zatem także rozwiązaniem problemu arbitrażowego (EAB, SQ). Jeśli jednak wybraliśmy punkt N jako rozwiązanie (AEC, SQ), ponieważ stanowi on rozsądny kompromis pomiędzy optymalnym dla Kolumny wynikiem A i optymalnym dla Wiersza wynikiem C, to czy nie powinniśmy, w sytuacji gdy wynik C nie jest osiągalny, a z dostępnych wyników najlepszym dla Wiersza jest B, wskazać jako rozwiązania raczej punkt M?
Według Nasha, jeżeli N było sprawiedliwsze od M, gdy możliwy był wynik C, to nie stanie się mniej sprawiedliwe tylko dlatego, że wynik C przestał być osiągalny. Sprawiedliwość jakiegoś rozwiązania nie może zależeć od tego, czy jakiś mało prawdopodobny wynik uzna się za wystarczająco prawdopodobny, by brać go pod uwagę, czy też nie.
Twierdzenie Istnieje dokładnie jeden schemat arbitrażowy spełniający aksjomaty 1-4: Jeżeli SQ=(x0,y0), to rozwiązaniem arbitrażowym jest należący do wieloboku wyników punkt N o takich współrzędnych (x,y), x≥x0, y≥y0, który maksymalizuje wartość iloczynu (x-x0)(y-y0). Twierdzenie wyklucza istnienie innych, spełniających aksjomaty Nasha schematów arbitrażowych. Zakłada ono maksymalizację iloczynu przyrostu użyteczności graczy względem status quo. Wygląda to tajemniczo, ale zauważmy, że zgadza się z aksjomatem 2. Jeśli, powiedzmy, przemnożymy wszystkie wartości x przez jakąś dodatnią stałą, także iloczyn (x-x0)(y-y0) będzie trzeba przemnożyć przez tę stałą, a więc wynik, który maksymalizował wartość tego iloczynu przedtem, maksymalizuje ją i teraz
Wyobraźmy sobie, że Pan Wiersz i Pani Kolumna muszą wybrać jeden z następujących wyników (liczby oznaczają odpowiednio użyteczności Wiersza i Kolumny): A=(0,0), B=(2,0), C=(4,2), D=(1,5), bądź teorię złożoną z wyników A, B, C, D z dowolnymi prawdopodobieństwami. Jeśli nie uda im się uzgodnić wyniku, zostanie nim SQ=(2,1). Przykład 1
Rozwiązanie Nasha musi należeć do zbioru negocjacyjnego – odcinka łączącego punkty (2,4) i (4,2) – i spośród wszystkich punktów należących do tego odcinka charakteryzować się największą wartością iloczynu (x-2)(y-1). Ponieważ równanie zbioru negocjacyjnego ma postać y=6-x, 2≤x≤4, wyrażenie, które należy maksymalizować to (x-2)(6-x-1)=-x2+7x-10. Ogólnie dla wyrażenia w postaci –ax2+bx+c, (a≥0) można wykazać, że wartość maksymalną osiąga ono, gdy x=b/(2a). W naszym przykładzie iloczyn osiąga swoje maksimum, gdy Rozwiązanie Wartości te są osiągane dla loterii .
Powyższy problem ma pewną specyficzna cechę: Zbiór wyników paretooptymalnych jest odcinkiem leżącym na prostej o nachyleniu -1. W takim przypadku można stosować nieskomplikowaną geometryczną metodę znajdowania rozwiązania Nasha: leży ono na przecięciu zbioru paretooptymalnego z prostą w nachyleniu +1, przechodzącą przez punkt SQ.
Przykład 2 Załóżmy, że możliwe wyniki to A=(1,8), B=(6,7), C=(8,6), D=(9,5), E=(10,3), F=(11,-1), G=(-1,-1), przy status quo SQ=(2,1). Jakie będzie rozwiązanie Nasha?
Zbiór negocjacyjny jest łamaną składającą się z kilku odcinków. Aby zorientować się gdzie może leżeć rozwiązanie arbitrażowe, policzymy wartość (x-2)(y-1) dla poszczególnych wierzchołków zbioru negocjacyjnego: Ponieważ wartość iloczynu jest największa dla C, rozwiązanie leży albo na odcinku BC, albo na odcinku CD.
Prosta zawierająca odcinek BC ma równanie y= 10 - ½ x, tak więc musimy maksymalizować wyrażenie (x-2)(10-½ x-1)= -½ x² + 10x -18 Wartość maksymalna jest osiągana, gdy x=10 – punkt ten leży już poza odcinkiem BC, za punktem C, tak więc wartość maksymalna w ramach odcinka BC osiągana jest w punkcie C. Podobnie można obliczyć że na odcinku CD wyrażenie (x-2)(y-1) maksymalizowane jest również w punkcie C. Tak więc C jest rozwiązaniem Nasha. Mając do dyspozycji sformułowane przez Nasha rozwiązanie ogólnego problemu arbitrażu, możemy zastosować je do wyznaczenia sprawiedliwego arbitrażowego rozwiązania gry o sumie niezerowej. Jako wielobok wypłat dla problemu arbitrażowego posłuży nam wielobok wypłat analizowanej gry. Musimy jeszcze znaleźć punkt status quo- wynik gry w sytuacji, gdy arbitraż nie powiedzie się. Jedną z możliwość jest uznanie, że po prostu nie wiemy co się wtedy stanie i przyjęcie jedynie, że każdy z graczy uzyska wypłatę odpowiadającą co najmniej jego poziomowi bezpieczeństwa- w takim przypadku przyjmujemy jako status quo punkt o współrzędnych równych poziomowi bezpieczeństwa Wiersza i Kolumny.
Dla gry 16.1 byłby to punkt SQ=(3⅓, 6). Rozwiązaniem arbitrażowym Nasha jest w tym przypadku Oznacza to że rekomendujemy graczom zagranie z prawdopodobieństwem 13/18 BA i AB z prawdopodobieństwem 5/18, bądź też, jeśli gra jest wielokrotnie powtarzana, ranie w 13 na 18 rozgrywek BA, a w pozostałych pięciu AB. Zaletą przyjęcia status quo w poziomach bezpieczeństwa jest to , że są one łatwe do wyznaczania, poza tym jednak takie postępowanie może budzić pewne wątpliwości. Sam Nash, gdy rozważał ten problem, zaproponował inny sposób wyznaczania status quo. Jego rozumowanie opierało się na założeniu, że jeżeli negocjacje nie powiodą się, gracze mogą starać się wpłynąć na wynik, stosując strategię gróźb: „jeśli negocjacje załamią się, przyjmę strategię, która będzie dla ciebie niekorzystna”.
Zgodnie z takim rozumowaniem, właściwym punktem status quo będzie punkt wyznaczony przez strategię gróźb. Wiedząc o tym, gracze będą formułowali swoje groźby w taki sposób, by uzyskać najkorzystniejszy status quo, uwzględniając fakt, że przeciwnik postępuje tak samo. Inaczej mówiąc wybór strategii gróźb sam w sobie jest grą. Jest to przy tym gra o sumie zerowej, której rozwiązanie określa optymalne strategie gróźb obu graczy. Zgodnie z propozycją Nasha, punktem status quo dla arbitrażu powinien być punkt wyznaczony przez optymalne strategie gróźb.
W bardziej skomplikowanych przypadkach wyznaczanie optymalnych strategii gróźb może być dosyć trudne rachunkowo. Zachodzi jednak jeden przypadek, kiedy rachunki są bardzo proste: wtedy, gdy zbiór negocjacyjny jest odcinkiem prostej o nachyleniu -1. w takim przypadku rozwiązanie arbitrażowe Nasha leży na przechodzącej przez punkt status quo linii o nachylenie +1. Oznacza to ,że różnica pomiędzy wypłatą Wiersza a wypłatą Kolumny w punkcie status quo będzie taka sama, jak w punkcie będącym rozwiązaniem arbitrażowym. Pan Wiersza chciałby żeby ta różnica była jak największa, a Kolumna- by było ona jak najmniejsza. Tak więc optymalne strategie gróźb Wiersza i Kolumny można wyznaczyć, analizując grę różnic – grę o sumie zerowej, w której wypłatami są różnice wypłat w oryginalnej grze o sumie niezerowej.
Dla przykładu przeanalizujemy następującą grę: Zbiorem negocjacyjnym jest odcinek łączący punkty (4,16) i (10,10), leżący na prostej o nachyleniu -1. Gra różnic ma punkt siodłowy dla pary
Strategii AA , a więc strategie A są optymalnymi strategiami gróźb dla obojga graczy. Oczywiście, w przypadku innych gier optymalne strategie gróźb mogą być strategiami mieszanymi. Jeśli zbiór negocjacyjny jakiegoś wieloboku wypłat jest pojedynczym odcinkiem o dowolnym ( z definicji jednak zawsze ujemnym) nachyleniu, to zawsze można go przekształcić w odcinek o nachyleniu -1, mnożąc użyteczności jednego z graczy przez odpowiednią stałą, po czym stosować opisaną wyżej metodę wyznaczania optymalnych strategii gróźb.
Zasadniczym wnioskiem płynącym z powyższych rozważań jest to, że jeżeli chcemy użyć schematu arbitrażowego Nasha do rozwiązania ogólnego problemu arbitrażu, to jego wynik dla gier o sumie niezerowej zależy od tego, w jaki sposób, naszym zdaniem, należy uwzględnić przewagę strategiczną jednego z graczy.