340 likes | 479 Views
DMBO. Dualność i gry. Problem pakowania plecaka – ilustracja dualności. Złodziej napada na magazyn z plecakiem . Plecak nie może być zbyt ciężki , bo złodziej go nie uniesie . W magazynie znajduje się dużo dobrze podzielnych towarów np . złoto , srebro , pył diamentowy .
E N D
DMBO Dualność i gry
Problem pakowaniaplecaka – ilustracjadualności • Złodziejnapadanamagazyn z plecakiem. • Plecakniemożebyćzbytciężki, bozłodziej go nieuniesie. • W magazynieznajdujesiędużodobrzepodzielnychtowarównp. złoto, srebro, pyłdiamentowy. • Złodziejchcezapełnićplecaknajbardziejcennymitowarami. Jakzdecydujeco wziąć do plecaka?
Model • Parametry: W – maksymalnawagaplecaka N – ilośćtowarów w magazynie wi – waga dobra i vi – wartość dobra i • Zmiennedecyzyjne: xi – jakdużotowaru i włożyć do plecaka (udziałcałościtego co jest w magazynie) • Funkcjacelu: Maksymalizujwartośćtowarów • Ograniczenia: (a) Złodziejniemożewziąćwięcejdanegotowaruniż jest w magazynie. • Złodziejnieuniesiewięcejniżplecak i siłypozwolą. • Złodziejniemożeukraśćujemnejilościtowarów (jeśli jest złodziejem)
Model • Problem możnazatemsformułowaćjako ZPL: Max
Przykładproblemuprymalnego: Problem złodzieja • Podstawmy N=3, W=4, w=(2,3,4) i v=(5,20,3) złoto, diamenty i srebro. max p.w. Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Wartośćfunkcjicelu: 22.5
Analiza • Tylkojedentowar (złoto) jest wybrany w częściułamkowej. Jest to ogólnazasada w problemach z pakowaniemplecaka z N towarami. • Intuicja: • Optymalnerozwiązanie w tymprzykładzie jest jednoznaczne. • Abyjednoznaczniewyznaczyć3 niewiadome, potrzebujemy 3 równanialiniowe. • Czyliprzynajmniej 3 naszeograniczeniamusząbyćspełnionew postacirówności. • Jednoograniczenie to wagaplecaka, ale pozostałedwadotycząilościtowarów 0≤xi≤1. • Zatemtylkojedentowarmożebyćwybrany w postaciułamkowej w optimum.
Syndykwykupujezłodzieja • Przypuśćmy, żesyndykatprzestępczychcewykupićskradzionetowary od złodzieja. • Proponująceny y1zazłoto, y2zadiamenty, y3zasrebrooraz y4za kilogram plecaka. • Ale złodziejmożeużyć 2 kilogramypojemnościplecaka i całeswojezłoto, abywygenerowaćzysk 5 jednostek, czyli 2y4+y1powinnowynosićprzynajmniej 5. Podobnie w przypadkupozostałychtowarów. • Syndykatchciałbyzminimalizowaćcałkowitącenę, którąpłacizłodziejowi y1+y2+y3+4y4 • Cenypowinnybyćnieujemne, inaczejzłodziejniesprzedatowarów i plecaka.
Przykładproblemudualnego: Problem syndyka • Problem syndykamożnazatemprzedstawićnastępująco: min p.w. Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) Optymalnawartośćfunkcjicelu: 22.5
Problem złodzieja: Jest równoważny: Ponieważ np. Przekształcamy: Ponieważ np. To jest równoważny problemowi syndyka:
Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) cenydualne Optymalnawartośćfunkcjicelu: 22.5 Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalnawartośćfunkcjicelu: 22.5
Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) cenydualne Optymalnawartośćfunkcjicelu: 22.5 Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalnawartośćfunkcjicelu: 22.5
Gry o sumie zerowej • W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie • Diagram przesunięć
Gry o sumie zerowej • Minimax = maximin = wartość gry • Gra może mieć wiele punktów siodłowych
Gry o sumie zerowej • Albo nie mieć ich wcale • Jaka jest wartość gry w takim przypadku? • Jeśli gra nie ma punktu siodłowego, trzeba wprowadzić strategie mieszane
Gry o sumie zerowej • Jeśli jest więcej niż dwie strategie dla jednego gracza i gra nie ma punktu siodłowego, nie wiadomo, które strategie będą częścią optymalnej strategii mieszanej • Niech mieszana strategia Kolumny będzie (x,1-x) • Wypłata Wiersza dla każdej jego strategii
Gry o sumie zerowej • Kolumna będzie wybierała x, aby zmaksymalizować „górną kopertę” (upperenvelope)
Gry o sumie zerowej • Przekształcamy w problem programowania liniowego
Studium przypadku: Teoria gier i dualność • W latach pięćdziesiątych, Davenport studiował zachowanie rybaków w małej wiosce na Jamajce.
Twenty-six fishing crews in sailing, dugout canoes fish this area [fishing grounds extend outward from shore about 22 miles] by setting fish pots, which are drawn and reset, weather and sea permitting, on three regular fishing days each week … The fishing grounds are divided into inside and outside banks. The inside banks lie from 5-15 miles offshore, while the outside banks all lie beyond … Because of special underwater contours and the location of one prominent headland, very strong currents set across the outside banks at frequent intervals … These currents are not related in any apparent way to weather and sea conditions of the local region. The inside banks are almost fully protected from the currents. [Davenport 1960]
Strategie 26 drewnianych kanoe. Kapitanowie tych kanoe mają do dyspozycji 3 strategie połowu: • IN – ustawić wszystkie kosze w zatokach • OUT – ustawić wszystkie kosze na wodach odsłoniętych • IN-OUT– część koszy w zatokach część na zewnątrz
Zalety i wady połowu na otwartym morzu WADY • Dopłynięcie do łowiska zabiera więcej czasu, więc można postawić mniej koszy • Jak prąd jest aktywny, powoduje duże zagrożenie dla koszy ustawionych na otwartym morzu • Znosi znaczniki • Uszkadza kosze podczas przesuwania • Zmiany temperatury wody mogą zabijać ryby wewnątrz koszy ZALETY • Ryby na łowiskach zewnętrznych są dużo lepszej jakości • Jeśli jest ich dosyć, mogą wyprzeć ryby z łowisk wewnętrznych zupełnie z rynku • Rybołóstwo na łowiskach zewnętrznych wymaga dużo lepszych kanoe • Zazwyczaj ci, którzy łowią na łowiskach wewnętrznych kupują używane kanoe od tych, którzy łowią na łowiskach zewnętrznych • Posiadanie lepszych kanoe daje dużo prestiżu, ponieważ ich kapitanowie dominują w corocznych wyścigach kanoe
Dane • Davenport zebrał dane dotyczące średnich dziennych zysków w zależności od strategii połowu oraz obecności/nieobecności prądu
1 Gra o sumie zerowej?? • Nie ma punktu siodłowego • Strategia mieszana – załóżmy, że „złośliwy” prąd „stosuje” strategię „Płynę” z prawdopodobieństwem p1, „Nie płynę” z prawdopodobieństwem p2 • Strategia rybaków: IN z prawd. q1, OUT z prawd. q2, IN-OUT z prawd. Q3 • Dla każdego p rybacy wybierają strategię (q) z maksymalną wypłatą • A „złośliwy” prąd wybiera p tak, aby rybacy zarobili jak najmniej
Rozwiązanie graficzne problemu prądu Solution: p=0.31 Optymalna strategia mieszana prądu
Podobnie w przypadku odwrotnym: • Dla każdej strategii rybaków q, prąd „wybiera” taką, dla której rybacy zarobią najmniej: • Rybacy natomiast będą się starali tak wybrać q, aby zmaksymalizować swoją wypłatę
Prognoza i obserwacja Gra o sumie zerowej Obserwacja Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Strategia rybaków: 69% IN, 31% IN-OUT [Oczekiwana wypłata: 13.38] Prąd: 25% PŁYNIE, 75% NIE PŁYNIE • Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach • Optymalna strategia rybaków: 67% IN, 33% IN-OUT [Oczekiwana wypłata: 13.31] • Optymalna strategia prądu: 31% PŁYNIE, 69% NIE PŁYNIE Konkluzja Davenporta: rybacy są dobrze przystosowani Odkrycie Davenporta przez parę lat nie zostało zakwestionowane aż do momentu …
Prąd nie jest złośliwy • Kozelka 1969 oraz Read, Read 1970 zauważyli, że • Prąd nie dostosowuje swojej „strategii” do działań rybaków • Dlatego rybacy powinni zastosować zasadę oczekiwanych zysków • Oczekiwane zyski rybaków • IN: 0.25 x 17.3 + 0.75 x 11.5 = 12.95 • OUT: 0.25 x (-4.4) + 0.75 x 20.6 = 14.35 • IN-OUT: 0.25 x 5.2 + 0.75 x 17.0 = 14.05 • Czyli wszyscy rybacy powinni łowić na zewnętrznych łowiskach • Może jednak nie są zbyt dobrze przystosowani
Prąd może być jednak złośliwy • Prąd nie rozumuje, ale łowienie na otwartym morzu jest bardzo ryzykowne. • Nawet jeśli prąd płynie ŚREDNIO 25% czasu, to jednak może płynąć częściej w danym roku. • Załóżmy, że w jednym roku prąd płynie 35% czasu. Oczekiwana wypłata: • IN: 0.35 x 17.3 + 0.65 x 11.5 = 13.53 • OUT: 0.35 x (-4.4) + 0.65 x 11.5 = 11.85 • IN-OUT: 0.35 x 5.2 + 0.65 x 17.0 = 12.87. • Poprzez potraktowanie prądu jak złośliwego gracza rybacy GWARANTUJĄ sobie wypłatę przynajmniej 13.31, niezależnie od tego, jak często płynie prąd • Rybacy płacą $1.05 składki ubezpieczeniowej
Skojarzenia http://mathsite.math.berkeley.edu/smp/smp.html