1 / 23

Gry o sumie niezerowej

Gry o sumie niezerowej. Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty Macierz A – straty gracza D1 Macierz B – straty gracza D2. Gry o sumie niezerowej. • Jeśli role graczy są symetryczne - równowaga Nasha

robbin
Download Presentation

Gry o sumie niezerowej

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gry o sumie niezerowej Dla 2 graczy trzeba zdefiniować 2 macierze (wypłat lub strat) dla każdego z graczy Zakładamy – obydwaj gracze minimalizują straty Macierz A – straty gracza D1 Macierz B – straty gracza D2

  2. Gry o sumie niezerowej • Jeśli role graczy są symetryczne - równowaga Nasha • Jeśli podejrzewamy, że przeciwnik będzie „złośliwy” - strategia minimaksowa - sprowadzamy właściwie problem do gry o sumie zerowej • Jeśli w grze występuje hierarchia w procesie decyzyjnym oraz pozycja graczy nie jest identyczna (symetrycza) - równowaga w sensie von Stackelberga

  3. John F. Nash, 1928- When the 21-year old John Nash wrote his 27-page dissertation outlining his "Nash Equilibrium" for strategic non-cooperative games, the impact was enormous. Słowa kluczowe: równowaga Nasha, Nash equilibrium

  4. Równowaga Nasha • Równowaga Nasha osiągnięta jest wówczas gdy jednostronne naruszenie równowagi (odejście od strategii dającej równowagę) pogarsza rezultat gracza podejmującego taką decyzję Założenia: • Rozpatrywać będziemy gry dwuosobowe, skończone i statyczne, w których gracze nie kooperują ze sobą • Obaj gracze D1 i D2 chcą minimalizować swoje straty; ich macierze wypłat to odpowiednio A i B; strategie D1 są w wierszach, a D2 w kolumnach

  5. Równowaga Nasha Para strategii (i0, j0) określa rozwiązanie równowagi Nasha w grze dwumacierzowej (A, B) jeśli spełnione są warunki

  6. Równowaga Nasha - przykład Dwaj użytkownicy korzystają ze wspólnego magazynu. Ich koszty związane są z kosztami pobierania z magazynu i stratami związanymi z niezaspokojeniem potrzeb, przy czym zależą od tego, jaką decyzję (1- pobrać, 2 - nie pobrać) podjął drugi użytkownik: A = B = Są dwa położenia równowagi Nasha 1. dla pary strategii (1,1), z rezultatem (15,20)2. dla pary strategii (2,2), z rezultatem (-15,0) para strategii (2,2) jest lepsza dla obu użytkowników

  7. Ocena strategii Para strategii (i1, j1) jest lepsza niż (i2, j2) jeśli oraz i przynajmniej jedna z tych nierówności jest ostra Strategie dopuszczalne Dopuszczalność strategii Para strategii Nasha jest dopuszczalna, jeśli nie istnieje para strategii od niej lepsza

  8. W przykładzie jedyną dopuszczalną parą strategii Nasha Jest para (2,2), stąd Jest ona "najrozsądniejsza". • Nie zawsze Jednak wybór strategii "rozsądnej" Jest możliwy, problem może posiadać bowiem więcej niż jedną dopuszczalną parę strategii, będących rozwiązaniem równowagi Nasha. • Przykładem takiego problemu może być para macierzy opisujących straty w jednym z klasycznych problemów teorii gier zwanym "walką płci".

  9. Walka płci Świerniak A.: Podejmowanie decyzji w sytuacjach konfliktowych. Skrypt Uczelniany Politechniki Śląskiej Nr 1791, Gliwice 1993

  10. Walka płci A = B = Istnieją dwie dopuszczalne pary strategii dopuszczalnych (1,1) i (2,2) z rezultatami odpowiednio (-2,-1) i (-1,-2) Gracze nie mogą się porozumieć — jeśli zagrają na różne punkty równowagi mogą uzyskać wynik niekorzystny dla obu stron tzn. (1,1)

  11. UWAGI: • Strategie punktu siodłowego są strategiami bezpiecznymi decydentów (z poprzedniego wykładu). • W problemach o sumie niezerowej można również zdefiniować strategie bezpieczne, przy czym strategie równowagi Nasha tylko w niektórych przypadkach są bezpieczne. Oczywiście strategie bezpieczne decydentów muszą być odnie­sione do ich macierzy strat, tzn. dla D^ do macierzy A dla D2 do B. • W przykładzie para strategii bezpiecznych wyznaczała punkt równowagi Nasha (1,1), ale nie było to rozwiązanie dopuszczalne. Inaczej jest w problemie zwanym w literaturze jako „dylemat więźnia”.

  12. Dylemat więźnia A = B = • Strategiami równowagi Nasha jest para (2, 2) dająca wynik (8, 8) • Dla obu graczy lepszym wynikiem jest (2, 2) uzyskiwany przy parze strategii (1,1). Tu konieczne jest całkowite zaufanie graczy do siebie - jednostronne odstępstwo dla drugiego z graczy grozi wynikiem 30. • Para strategii (2, 2) jest natomiast bezpieczna. Zostałaby uzyskana, gdyby każdy z graczy uważał grę za problem o sumie zerowej i wybierał strategię minimaksową dla odpowiedniej gry

  13. UWAGI: • Wybór strategii bezpiecznych w problemie o sumie niezerowej bywa uzasadniony, nawet gdy strategie te nie prowadzą do równowagi niekooperacyjnej (Nasha). • Jest tak zwłaszcza w przypadku, gdy istnieją dwie lub więcej nie­wymienialnych par równowagi Nasha lub gdy decydenci nie są całkowicie pewni rozumowania konkurentów, czy wartości strat. • Mówimy wówczas o parze strategii minimaksowych dla decydentów w problemie o sumie niezerowej, a poziomy bez­pieczeństwa decydentów nazywane są wartościami minimax. • Działanie takie odpowiada założeniu, że przeciwnik nie tyle dba o minimalizację swoich strat, ile chce nam przeszkodzić w realizowaniu najlepszych dla nas rozwiązań. • Wartości rozwiązań minimaksowych są nie lepsze (a więc nie mniejsze) niż pary wartości jakiegokolwiek rozwiązania równowagi Nasha

  14. Równowaga von Stackelberga • Role graczy są niesymetryczne —jeden z graczy, leader, ma możliwość forsowania swojej strategii w stosunku do drugiego gracza followera •Wymagamy równowagi hierarchicznej • Zadaniem followera jest racjonalna reakcja na decyzje leadera

  15. Heinrich Freiherr von Stackelberg

  16. Równowaga von Stackelberga Zbiór racjonalnych reakcji (optymalnych odpowiedzi) followera (gracz D2) Strategie von Stackelberga dla leadera i0 (S* - koszt dla leadera) Element jR(i0) to odpowiedź followera na strategię i0leadera Para (i0, j0) jest rozwiązaniem równowagi Stackelberga

  17. Przykład 1 A = B = • Para (2,2) jest w równowadze Nasha, wynik (1,0) • Para (1,1) jest w równowadze von Stackelberga z D1 jako leaderem z wynikiem (0,-1) • Para (1,3) jest w równowadze von Stackelberga z D2 jako leaderem z wynikiem (1.5, -0.75)

  18. Przykład 2 - problem przydziału wody • Decydent D2: • Pobór pełny (P) • Pobór ciągły (C) • Pobór okresowy (T) • Decydent D1: • Otwiera tamę (1) • Zamyka tamę (2) Miara strat D1: odchyłka od przyjętej polityki retencjonowania zbiorników Miara strat D2: niezaspokojenie własnego zapotrzebowania na wodę

  19. Przykład 2 - problem przydziału wody A = B = D1 - leader Jeśli D1 zadeklaruje strategię 1, to D2 ma do dyspozycji dwie strategie: P oraz T. R(1) = {P, T} Jeśli D1 zadeklaruje strategię 2, to D2 ma do dyspozycji dwie strategie: P oraz C. R(2) = {P, C}

  20. R(1) = {P, T} R(2) = {P, C} Przykład 2 - problem przydziału wody A = B = Decyzja D1: 2, Koszt Stackelberga dla leadera wynosi S(A)=3 D1 może osiągnąć niższy koszt, w zależności od tego, czy D2 wybierze P, czy C

  21. Uwagi • Jak łatwo zauważyć każdorazowo leader osiąga wynik lepszy niż odpowiadający mu wynik w równowadze Nasha. • Własność ta jest zachowana jednak tylko wówczas, gdy zbiór racjonalnych reakcji followera na i-te zagranie leadera jest jednoelementowy i to dla wszystkich możliwych strategii leadera. • Nawet w przypadku, gdy odpowiedź na strategię Stackelberga leadera jest określona jednoznacznie wynik równowagi Nasha może być korzystniejszy niż koszt Stackelberga dla leadera, jeśli zbiory reakcji racjonalnych na inne zagrania nie są jednoelementowe

  22. Przykład 3 A = B =

  23. Równowaga Nasha określona jest przez parę strategii (2, 1) i daje wynik (-1, 1) podczas gdy równowaga Stackelberga z D1 jako leaderem zdefiniowana jest parą (1, 1) i wynikiem (0, 0) - gorszym dla leadera niż wynik Nasha !

More Related