170 likes | 295 Views
Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s 1 , …, s N ) potenciálfüggvény, ami mindegyik x játékosra kielégíti az alábbi feltételt ( N -személyes játék esetén):.
E N D
Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s1, …, sN) potenciálfüggvény, ami mindegyik x játékosra kielégíti az alábbi feltételt (N-személyes játék esetén): ahol ux(sx;s-x) az x játékos nyereménye, ha sx stratégiát követ, miközben a többiek stratégiaprofilját s-x-szel jelöljük. A potenciálfüggvény fontos tulajdonsága, hogy a stratégiáját változtató játékos nyereményváltozásából épül fel. Ez a feltétel általában erős megszorítást jelent a nyeremények lehetséges értékeire, mert a potenciálváltozás összege zárt hurkok mentén 0. A játékcsalád különleges tulajdonsága, hogy megfelelő evolúciós (dinamikai) szabály esetén a rendszerben a lehetséges stratégiaprofilok valószínűségét a Boltzmann-Gibbs sokasággal írhatjuk le, vagyis érvényesek lesznek az egyensúlyi statisztikus fizika és a termodinamika törvényei.
Általános tulajdonságok kétszemélyes játékoknál 1) A bimátrixot mátrixra képezzük le: 2) Linearitás és egy tetszőlegesen megválasztható konstans: 3) additivitás, azaz ha 4) szimmetrikus játéknál
Általános tulajdonságok (folytatás) 5) Ha a kétszemélyes szimmetrikus játéknál (A=B) a nyereménymátrix szimmetrikus, azaz, ha A=A+, akkor V=A . 6) A potenciál nem változik, azaz V=V’ , ha ez a tulajdonság jelentősen növeli a potenciál játékok halmazát. 7) Egy játék akkor és csak akkor potenciál játék, ha annak minden 2x2-es részjátéka potenciál játék. Ez a Kirchhoff törvények következménye. 8) Párkölcsönhatások összegzésével is felépíthető egy sokszereplős potenciál játék, pl.: ahol az összegzés az xy játékos párokra történik és Jxy egy csatolási állandó. Egy x játékos több y játékostárssal is részt vehet a játékban.
Minden szimmetrikus kétszemélyes kétstratégiás játék potenciál játék Gráf reprezentáció: pontok = tiszta stratégia profilok (mikroállapotok) élek = lehetséges átmenetek, ha csak egy játékos vált stratégiát Stratégia pár: (fehér és/vagy fekete) pont-pár, Nyeremény pár: (Aij, Bji) A változtató játékos nyereményének változása az élek mentén. Összegük 0 a hurok mentén. S S 1-T 1-T A potenciál létezik, ha Ugyanez társadalmi dilemmák szokásos jelölésében: Folyamábra: A nyilak a magasabb potenciált jelölik. Nincs irányított hurok. Tiszta Nash egyensúly = pont kimenő élek nélkül Sorrendi potenciál játék: hasonló folyamábra.
Nemszimmetrikus 2x2-es potenciál játékok A társadalmi dilemmák jelölését használva a potenciál létezik és alakja: ha a+b+c=0 Két hangolható paraméter (pl. a és b) Ellenpélda (snóbli, vagy matching pennies): folyamábra: Ha (a+b+c) ≠ 0, akkor a játék A snóbli képviseli azt a 2x2-es kölcsönhatást, ami „kavar” az állapottérben.
Szimmetrikus 3x3-as potenciál játékok A potenciál származtatásánál csak az aszimmetrikus résszel kell foglalkozni. (Kirchhoff törvények) A potenciál létezik, ha a+b+c=0, és ekkor Egyébként a G=(A,A) játék szétcsatolható, azaz A kő-papír-olló játék a játékok egy másik olyan 3x3-as játék, ahol nincs potenciál, és folyamábrája irányított hurkot tartalmaz.
Folyamábra a potenciál játékoknál A nyilak a jobb egyéni választás irányába mutatnak Nincs irányított hurok Példa: koordinációs játék négy személlyel, mindegyikük két lehetőség közül választ állapottér: 4-dimenziós „kocka” egyszerre csak egy játékos változtat Tiszta Nash egyensúly(ok) megtalálása: Véletlen kezdőállapotban a véletlenül választott játékosok új véletlen stratégiát választanak, ha az nekik megéri. Előbb-utóbb a rendszer elér egy olyan állapotot, ahonnan már senkinek sem éri meg eltérni, vagyis nincs kifelé mutató él, ami egy NE. Ugyanez a sorrendi potenciál játékokra is igaz. Maximális potenciál = NE = Nash egyensúly Több tiszta Nash egyensúly is létezhet. gráfelméleti tételek
Térbeli potenciál játékok N azonos játékost egy négyzetrács x pontjain helyezünk el. Periodikus határfeltétel biztosítja az eltolási szimmetriát. x játékos stratégiái: A potenciál az első szomszédok közötti kétszemélyes potenciál játékból épül fel: Ising modell: σx= -1, +1 (spin fel, spin le) állapotok Energia: J: csatolási állandó (J > 0: ferromágneses)h: külső mágneses tér Rács gáz modell: nx=0, 1
Sztochasztikus dinamika A „logit” szabály a nagyobb egyéni nyeremény illetve a magasabb U(s) potenciál irányába tereli a rendszert hasonlóan a Glauber, vagy Metropolis dinamikákhoz, amelyek a magasabb U potenciállal jellemzett állapot valószínűségét növelik. Mindegyik rendszer a Boltzmann eloszlásba fejlődik, azaz s valószínűsége: ami kielégíti a részletes egyensúly feltételét minden lehetséges oda-vissza átmenet esetében A részletes egyensúly és a Boltzmann eloszlás változatlanul megmarad, ha az oda-vissza átmenetek w(s→s’ ) és w(s’→s) valószínűségét ugyanazzal a szorzófaktorral megváltoztatjuk. Analógia a közlekedő edényekkel.
A teljes potenciál, aminek változása megegyezik a stratégiáját változtató játékos nyereményváltozásával (ez a hajtóerő): hasonlít az Ising modell energiájára (H=-Utotal), ha Kinetikus Ising modell: (a Hamiltonian nem definiálja a mozgást!) Glauber-dinamika: (kölcsönhatás egy külső hőtartállyal) egy spin átfordul az x helyen, azaz sx→ s’x megváltozik a spinek eloszlása {s} → {s}’ változik a rendszer energiája: H → H’ Az elemi folyamat valószínűsége csak az energiakülönbségtől függ és kielégíti a részletes egyensúly feltételét a termodinamikai egyensúlyban: Az oda- és visszaugrálás gyakorisága azonos a termodinamikai egyensúlyban.
Boltzmann-eloszlás származtatása az entrópia-maximum elvből Entrópia: Feltételek: normalizálás: átlagos potentiál: A variációszámítás szabályai szerint a következő egyenletrendszert kell megoldani Majd az αandβ Lagrange multiplikátorok megválasztásával kielégítjük a feltételeket. Az algebrai számolás eredménye: Következmények: Termodinamika érvényes Extrémum elvek működnek Statfiz módszerei használhatóak
Ising modellel azonos térbeli 2x2-es evolúciós játékok (U=-H) Társadalmi dilemma jelölésben (D és C stratégiák): Mágneses Ising modell: z szomszéd A paraméterek összehasonlításából: J>0 : ferromágneses rend J<0 : anti-ferromágneses (sakktábla) rend h>0 : homogén spin fel állapot h<0 : homogén spin le állapot A J=0 eset „áljátéknak” felel meg (pl. adományozó vagy közlegelő játékok)
Jelenségek az Ising modellben négyzetrácson (z=4) Ferromágneses eset = Koordinációs játék (Linux vagy Windows) Szimulációk Rendeződés, ha T<Tc, Rendezetlen állapot, ha T>Tc Stacionáris állapot: M mágnesezettség, ha sx=1, -1: □: Monte Carlo szimuláció -----: Onsager (1944) 2-dimenziós egzakt megoldása
Rendeződési folyamat antiferromágneses modellnél vagy az antikoordinációs játéknál, pl.: héja-galamb Szimuláció Tc felett Szimuláció Tc alatt A hosszútávú rendezett állapotot az alrácsmágnesezettség különbségével jellemezzük, azaz a négyzetrácsot két (A és B) alrácsra bontjuk a sakktábla fehér és sötét négyzeteinek megfelelően és a rendparaméter: Négyzetrácson a ferromágneses és az anti-ferromágneses modell egymásba képezhető, ha Következmény: A ferromágneses és anti-ferromágneses rendszerek viselkedése hasonló.
Kritikus átmenet Tc közelében Mágnesezettség (H=0): Fajhő (H=0): Szuszceptibilitás: Korrelációs hosszúság: Mágnesezettség Tc-nél: Korrelációs fv. Tc-nél Kitevők közötti összefüggések: (d a rács térbeli dimenziója) 2d Ising kitevők Az univerzáliskitevők értékei számos technikai részlettől függetlenek (pl. rács típusa, koordinációs szám, a kh. és dinamika részletei) Súlyos következmények a Monte Carlo szimulációs adatok meghatározásnál: a nagyobb korrelációs hossz, hosszabb relaxációs idő, nagyobb fluktuáció miatt jelentősen kell növelni a futási időt Tc-hez közeledve
Doménnövekedés A tipikus doménméret t1/2 -vel arányos, ha véletlen kezdőállapotból indulunk T<Tc-nél Szimuláció különböző dinamikáknál Us : állandósult nyeremény U(t) : időfüggő nyeremény Szaggatott vonal : t-1/2 Ezekben az esetekben a felületi feszültség minimalizálása hajtja a doménnövekedést. A felületi feszültségből származó hajtóerő megszűnhet, amikor párhuzamos (egyenes) doménfalak jönnek létre a tóruszon, amit a periodikus határfeltétel miatt választunk. Ez a kellemetlenség M meghatározásánál elkerülhető, ha rendezett állapotból indítjuk a rendszert. A doménnövekedés lelassul Tc közelében (kritikus lelassulás) és nagyon alacsony hőmérsékleten is (a lokális változások ritkulása miatt). T≈0.6 Tcajánlott.
Házi feladat 6.1. Hányszorosára kell növelni a futási időt Monte Carlo szimuláció esetén a rendparaméter (M) meghatározásánál, ha a (T-Tc) értékét megfelezzük a kritikus pont közelében? Tételezzük fel, hogy ugyanazt a relatív pontosságot kívánjuk elérni. 6.2. Hány független 4-es hurok van a kétszemélyes négystratégiás játékoknál a Kirchhoff törvények szerint, és ezeknél milyen további feltételek egyszerűsítik potenciál létezésének kritériumát, ha a játék szimmetrikus (A=B)? 6.3. Potenciál játék marad-e az önkéntes Fogolydilemma játék, ha a C és D stratégiák mellett megengedjük a távolmaradást, mint harmadik L (loner) stratégiát, és a nyereménymátrix alakja a következő: