1 / 34

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski . Princeton meeting 1949. John von Neumann 1903-1957. John Forbes Nash 1928-. Jak grać?. Równowaga Nasha. Przypisanie graczom strategii, tak iż żadnemu z graczy,

hiroshi
Download Presentation

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Stochastyczne modele gier ewolucyjnychJacek MiękiszInstytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski

  2. Princeton meeting 1949 John von Neumann 1903-1957 John Forbes Nash 1928-

  3. Jak grać? Równowaga Nasha Przypisanie graczom strategii, tak iż żadnemu z graczy, przy ustalonych strategiach wszystkich innych graczy, nie opłaca się zmienić swojej strategii

  4. Formalnie gra w jelenia i zająca (St,St) równowaga efektywna (H,H) równowaga bezpieczna średnia St - 5/2 Średnia H - 3 problem wyboru równowagi

  5. Dynamika populacji czas A i B - dwa możliwe zachowania, fenotypy, strategie osobników

  6. Prosty model ewolucji Selekcja osobnicy oddziałują w parach – grają w gry uzyskują wypłaty = liczba potomstwa Fenotypy są dziedziczone Potomstwo może mutować

  7. Dobór osobników do gry każdy gra z każdym losowe spotkania graczy gry na grafach, populacje ze strukturą przestrzenną

  8. Stochastyczna dynamika skończonych populacji n - liczba osobników zt - liczba osobników grających A w czasie t Ω ={0,…,n} - przestrzeń stanów selekcja zt+1 > zt jeśli „średnia” z A > „średnia z B mutacje Każdy osobnik może zmienić swoją strategię z prawdopodobieństwem ε

  9. Łańcuch Markowa z jedyną miarą stacjonarną μεn

  10. Klasyczne wyniki Każdy gra z każdym, Kandori-Mailath-Rob 1993 a>c i d>b, (A,A) i (B,B) – równowagi Nasha A B A a b B c d A jest stategią efektywną, a>d B jest strategią dominującą ze względu na ryzyko c+d>a+b

  11. Losowy dobór graczy, Robson - Vega Redondo, 1996 pt liczba krzyżowych spotkań

  12. JM J. Theor. Biol, 2005 Twierdzenie

  13. Lemat drzewny (Freidlin and Wentzell) ergodyczny łańcuch Markowa ze skończona przestrzenią Ω, macierzą przejścia Pε, i jedyną miarą stacjonarną με z2 z1 z3 Pε (z4|z1) z4 z5 x

  14. Gry przestrzenne z lokalnymi oddziaływaniami

  15. Dynamika deterministyczna reguła najlepszej odpowiedzi i Br(St,St)=St Br(H,H)=H Br(H,St)=Br(St,H)=H

  16. Dynamika stochastyczna a) zaburzona najlepsza odpowiedź z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się , b) reguła log-linear

  17. Jeleń i zając na Z, z oddziaływaniem najbliższych sąsiadów i zaburzoną najlepszą odpowiedzią liczenie błędów

  18. Otwarty problem konstrukcja gry przestrzennej z jedyną miarą stacjonarną μεΛ która ma następujące własności

  19. Dylemat Więźnia na grafach losowych wspólna praca z Bartoszem Sułkowskim C D C 3 0 D 5 1 (D,D) jest jedyną równowagą Nasha

  20. Grafy Poissona Każdą parę wierzchołków łączymy krawędzią z prawdopodobieństwem p Rozkład stopni wierzchołków jest rozkładem Poissona Bezskalowe grafy typu Barabasi-Alberty Reguła preferencyjnego linkowania Rozkład stopni wierzchołków ~ k-λ

  21. dynamika imitacji C C D C C D C 3 0 D 5 1 C D C 2 -1 D 4 0 gracze z lewej dostają 3 środkowy gracz 6 prawy gracz dostaje 5 gracze z lewej dostają 2 środkowy gracz 3 prawy gracz dostaje 4 D zmienia się w C środkowe C zmienia się w D

  22. C D C 1 0 D T 0 C D C 1-γ -γ D T-γ -γ γ - koszt połączenia dynamika imitacji najlepszej strategii z otoczenia średni poziom współpracy w stanie stacjonarnym

  23. Co dalej? gry na grafach losowych koewolucja sieci powiązań i strategii

  24. Deterministyczna dynamika replikatorowa A B A a b U = B c d pA(t) – liczba osobników grających A w czasie t pB(t) – liczba osobników grających B w czasie t Proponujemy UA = ax + b(1-x) UB = cx + d(1-x) Uav = xUA +(1-x)UB pA(t+ε)=(1-ε)pA(t) + εpA(t)UA(t)

  25. pA(t+ε) = (1-ε)pA(t) + εpA(t)UA(t) pB(t+ε) = (1-ε)pB(t) + εpB(t)UB(t) p(t+ε) = (1-ε)p(t) + εp(t)Uav(t)

  26. dx/dt = x(1-x)(UA – UB) Jeleń - Zając J Z J 5 0 Z 3 3 ∙←←←←←∙→→→∙ 0 3/ 5 1 mieszana równowaga jest niestabilna Jastrząb - Gołąb J G J -1 2 G 0 1 ∙→→→→∙←←←←∙ 0 1/2 1 mieszana równowaga jest stabilna

  27. Opóźnienia ( dla Jastrzębia i Gołębia) →→→→x*←←←← opóźnienie społeczne Zakładamy, że osobnicy w czasie t naśladują strategie, które miały większe wypłaty w czasie t-τ. Proponujemy

  28. odpowiednie równanie replikatorowe w czasie ciągłym ma postać Twierdzenie (Jan Alboszta i JM, J. Theor. Biol. 231: 175-179, 2004) x* jest asymptotycznie stabilny jeśli τ jest odpowiednio małe x* jest niestabilny dla odpowiednio dużego τ

  29. Biologiczne opóźnienie Zakładamy,że osobnicy rodzą się τ czasu po tym jak ich rodzice grali i uzyskali wypłaty. Proponujemy Twierdzenie (JA i JM, JTB 2004) x* jest asymptotycznie stabilny dla każdego opóźnienia τ

  30. Stochastyczna dynamika z opóźnieniem na grafach a) zaburzona najlepsza odpowiedź na stan w t-τ , z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź z prawdopodobieństwem ε gracz myli się b) zaburzona imitacja stanu w t-τ z prawdopodobieństwem 1-ε gracz imituje najlepszego gracza z prawdopodobieństwem ε gracz myli się

  31. Dziękuję za uwagę www.mimuw.edu.pl/~miekisz

More Related