1 / 54

Marinelli Claudia

EQUILIBRI DI NASH E ROUTING EGOISTICO. Marinelli Claudia. Introduzione alla TEORIA DEI GIOCHI. Introduzione alla TEORIA DEI GIOCHI Definizione ( Gioco strategico)

abel-spence
Download Presentation

Marinelli Claudia

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. EQUILIBRI DI NASH E ROUTING EGOISTICO Marinelli Claudia

  2. Introduzione alla TEORIA DEI GIOCHI • Introduzione alla TEORIA DEI GIOCHI • Definizione (Gioco strategico) Un gioco strategicoè un modello di interazione tra soggetti che devono decidere quali azioni compiere per raggiungere un determinato obiettivo. • Definizione (Teoria dei giochi) E’ la scienza che studia i giochi strategici.

  3. Introduzione alla TEORIA DEI GIOCHI • Un gioco strategico consiste di: • un insieme di giocatori; • per ogni giocatore, un insieme di azioni; • per ogni giocatore, preferenze sull’insieme di profili.

  4. Introduzione alla TEORIA DEI GIOCHI • Funzione di payoff E’ possibile rappresentare le preferenze attraverso una funzione di guadagno(payoff), che associa un numero ad ogni profilo in modo tale che i profili con numeri più alti sono preferiti rispetto a quelli con numeri più bassi. Più precisamente, la funzione di payoff rappresenta le preferenze di un soggetto se per ogni coppia di profili , risulta: se e solo se il soggetto preferisce il profilo al profilo .

  5. Introduzione alla TEORIA DEI GIOCHI • Problema: Quali azioni saranno scelte dai giocatori? • Ogni giocatore cerca di massimizzare il proprio guadagno. • In generale, l’azione migliore per un giocatore dipende dall’azione degli altri partecipanti. • Il giocatore deve formulare una teoria sulle azioni degli altri giocatori.

  6. Equilibri di Nash • EQULIBRI DI NASH • Definizione (EQULIBRIODINASH) Un equilibrio di Nash è un profilo di azione con la proprietà che nessun giocatore può fare meglio scegliendo un’azione differente da , assumendo che ogni altro giocatore aderisce a . • Nello stato idealizzato in cui i giocatori di ogni partita del game sono scelti in maniera casuale da una collezione di popolazioni, un equilibrio di Nash corrisponde ad uno stato stabile. • Se, ogni volta che viene fatta una partita, il profilo delle azioni è quello dell’equilibrio di Nash , allora nessun giocatore ha qualche ragione per scegliere un’azione differente dalla propria componente di .

  7. Equilibri di Nash Questa definizione non implica nè che ogni gioco strategico ha un equilibrio di Nash nè che ce ne sia al più uno per ogni gioco strategico. Uno dei giochi strategici più noti è il “Dilemma Del Prigioniero”. Il suo nome viene da una storia che coinvolgeva due sospetti in un crimine; la sua importanza viene dalla grande varietà di situazioni in cui i partecipanti hanno a che fare con decisioni simili a quelle messe di fronte ai due sospetti della storia.

  8. Equilibri di Nash – “Il Dilemma del prigioniero” • Esempio : “ Il Dilemma del Prigioniero” Due sospetti in un grave crimine sono messi in due celle separate. Ci sono abbastanza prove da incolpare ognuno dei due di un crimine minore, ma non abbastanza prove da incolpare uno dei due del crimine maggiore, a meno che uno dei due non agisca da informatore contro l’altro (Quiet). Se entrambi stanno zitti (Fink), ognuno dei due sarà accusato del crimine minore e saranno condannati ad un anno di prigione. Se uno e solo uno dei due confessa, egli sarà liberato e sarà usato come testimone contro l’altro, che sarà condannato a quattro anni di prigione. Se entrambi confessano, saranno condannati entrambi a tre anni di prigione.

  9. Equilibri di Nash – “Il Dilemma del prigioniero” • Modello • Giocatori : I due sospetti. • Azioni {Quiet,Fink} • Preferenze L’ordine dei profili di azione dal migliore al peggiore: • primo sospetto • (Fink,Quiet) lui viene liberato • (Quiet,Quiet) lui viene condannato ad un anno di prigione • (Fink,Fink) lui viene condannato a tre anni di prigione • (Quiet,Fink) lui viene condannato a quattro anni di prigione

  10. Equilibri di Nash – “Il Dilemma del prigioniero” • secondo sospetto Per gli stessi motivi, l’ordine dei profili di azione del secondo sospetto è: • (Quiet,Fink) • (Quiet,Quiet) • (Fink,Fink) • (Fink,Quiet). Possiamo rappresentare il gioco in maniera compatta in una tavola. Per prima cosa scegliamo le funzioni di payoff che rappresentano gli ordinamenti delle preferenze dei due sospetti.

  11. Equilibri di Nash – “Il Dilemma del prigioniero” Per il primo sospetto abbiamo bisogno di una funzione per la quale Una semplice specifica sarebbe Allo stesso modo, per il secondo sospetto potremmo scegliere la funzione per la quale .

  12. Equilibri di Nash – “Il Dilemma del prigioniero” Usando queste rappresentazioni, il gioco è illustrato nella seguente figura . sospetto 2 Quiet Fink Quiet sospetto 1 Fink Esaminando le quattro possibili coppie di azioni possiamo vedere che la coppia (Fink,Fink)è l’unico equilibrio di Nash. *

  13. Equilibri di Nash – “Il Dilemma del prigioniero” • La coppia (Fink,Fink)è un equilibrio di Nash perché: • Se fissiamo che il secondo giocatore sceglie Fink, per il primo giocatore è meglio scegliere Fink piuttosto che Quiet, dato che nel primo caso avrebbe un guadagno di 1 maggiore del guadagno di 0 che avrebbe nel secondo caso. • Analogamente, se fissiamo che il primo giocatore sceglie Fink, per il secondo giocatore è meglio scegliere Fink piuttosto che Quiet, dato che nel primo caso avrebbe un guadagno di 1 maggiore del guadagno di 0 che avrebbe nel secondo caso.

  14. Equilibri di Nash – “Il Dilemma del prigioniero” Pertanto, se uno dei due giocatori si sposta unilateralmente da Fink a Quiet passerebbe da un guadagno positivo ad un guadagno nullo. • Nessun altro profilo è un equilibrio di Nash: • (Quiet,Quiet)non è un equilibrio di Nash perché sia al primo che al secondo giocatore convienecambiare unilaterlamente la propriaazione dato che, in tal caso, passerebbe da un guadagno di 2 ad un guadagno di 3. • (Fink,Quiet)non è un equilibrio di Nash perché al secondo giocatore conviene cambiare unilateralmente la propria azione dato che, in tal caso, passerebbe da un guadagno di 0 ad unguadagno di 1.

  15. Equilibri di Nash – “Il Dilemma del prigioniero” • (Quiet,Fink)non è un equilibrio di Nash perché al primo giocatore conviene cambiare unilateralmente la propria azione dato che, in tal caso, passerebbe da un guadagno di 0 ad un guadagno di 1. Nel dilemma del prigioniero, il problema principale è se i giocatori devono cooperare o no. Nel seguente gioco, i giocatori sono daccordo nel cooperare, ma sono in disaccordo sulla migliore soluzione.

  16. Equilibri di Nash – “Bach o Stravinsky?” • Esempio: “Bach o Stravinsky?” Due persone vogliono uscire insieme. Ci sono due concerti disponibili: uno di musica di Bach ed uno di musica di Stravinsky. Una persona preferisce Bach e l’altra preferisce Stravinsky. Se essi vanno a concerti differenti, entrambi saranno scontenti allo stesso modo.

  17. Equilibri di Nash – “Bach o Stravinsky?” Bach Stravinsky Bach Stravinsky • (Bach,Bach): Se il giocatore 1 si sposta da Bach a Stravinsky, il proprio payoff decresce da 2 a 0; se il giocatore 2 passa da Bach a Stravinsky il suo payoff decresce da 1 a 0. Pertanto questo è un equilibrio di Nash.

  18. Equilibri di Nash – “Bach o Stravinsky?” • (Bach,Stravinsky): Se il giocatore 1 si sposta da Bach a Stravinsky, il suo payoff cresce da 0 a 1, quindi questo non può essere un equilibrio di Nash. • (Stravinsky,Stravinsky): Se il giocatore 1 si sposta da Stravinsky a Bach, il proprio payoff decresce da 1 a 0; se il giocatore 2 passa da Stravinsky a Bach il suo payoff decresce da 2 a 0. Pertanto questo è un equilibrio di Nash.

  19. Equilibri di Nash – “Bach o Stravinsky?” Bach Stravinsky Bach Stravinsky • (Stravinsky,Bach): Se il giocatore 2 si sposta da Bach a Stravinsky, il suo payoff cresce da 0 a 2, quindi questo non può essere un equilibrio di Nash.

  20. Equilibri di Nash – “Bach o Stravinsky?” Concludiamo, quindi, che il gioco ha due equilibri di Nash, che corrispondono agli stati in cui entrambi i giocatori scelgono la stessa azione. Come il dilemma del prigioniero, questo esempio modella una grande varietà di situazioni. Vediamo ora un caso di gioco puramente conflittuale.

  21. Equilibri di Nash – “Matching Pennies” • Esempio: “Matching Pennies” Due persone, ognuna delle quali ha una moneta, devono simultaneamente mostrare un lato (Testa o Croce) delle loro monete. Se entrambi mostrano lo stesso lato, la seconda persona paga un euro alla prima persona; se mostrano lati differenti, la prima persona paga un euro alla seconda persona. Ogni persona è attenta solo alla quantità di soldi che riceve e, ovviamente, preferisce ricevere piuttosto che dare.

  22. Equilibri di Nash – “Matching Pennies” Un gioco strategico che modella questa situazione è mostrato nella figura Testa Croce Testa Croce In questo gioco, gli interessi dei giocatori sono diametralmente opposti (un gioco del genere è detto “strettamente competitivo”): il giocatore 1 preferirebbe fare la stessa azione del giocatore 2, mentre quest’ultimo preferirebbe fare un’azione diversa da quella del giocatore 1.

  23. Equilibri di Nash – “Matching Pennies” Controllando ognuna delle quattro possibili coppie di azioni possiamo immediatamente vedere che questo gioco non ha un equilibrio di Nash. Infatti: • (Testa,Testa) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Testa a Croce portando, così, il suo guadagno da -1 a +1. • (Croce,Croce) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Croce a Testa portando, così, il suo guadagno da -1 a +1

  24. Equilibri di Nash – “Matching Pennies” • (Testa,Croce) non può essere un equilibrio di Nash perché all’agente 1 conviene passare da Testa a Croce portando, così, il suo guadagno da -1 a +1. • (Croce,Testa) non può essere un equilibrio di Nash perché all’agente 2 conviene passare da Croce a Testa portando, così, il suo guadagno da -1 a +1.

  25. Equilibri di Nash – Prezzo dell’anarchia • Prezzo dell’anarchia Koutsoupias, Papadimitriou • Definizione Dati un gioco e una funzione sociale (somma delle funzioni di payoff di tutti i giocatori) ,sia l’insieme di tutti gli equilibri di Nash e lo stato di che ottimizza . Ilprezzo dell’anarchia del gioco rispetto a è definito come: • Misura la perdita di ottimalità di un sistema non regolato a causa della mancanza di cooperazione tra i giocatori e di coordinazione centrale.

  26. Equilibri di Nash – Prezzo dell’anarchia Per spiegare come definire e misurare la qualità di uno stato stabile, riprendiamo l’esempio del “Dilemma del prigioniero”, in cui il problema principale è se i giocatori devono cooperare o no. Se i due sospetti potessero cooperare, si accorderebbero sullo stato (Quiet,Quiet) = OPT. Ne consegue che il prezzo dell’anarchia risulta essere:

  27. Equilibri di Nash – Prezzo dell’anarchia • Subottimalità degli Equilibri di Nash • In generale, un comportamento egoistico di agenti che popolano un sistema non cooperativo può risultare in uno stato stabile, il cui valore sociale può essere lontano dall’ottimo sociale.

  28. Routing egoistico della rete • ROUTING EGOISTICO: INTERNET Un problema fondamentale nella gestione di traffico a larga scala e nelle reti di comunicazione è quello del routing del traffico per ottimizzare le prestazioni della rete. • Problema Data una quantità di traffico tra ogni coppia di nodi della rete, trovare i percorsi che minimizzano la somma dei tempi di attesa (latenza totale).

  29. Routing egoistico della rete Risulta spesso difficile (quasi impossibile) imporre strategie di routing ottimali o quasi-ottimali sul traffico di una rete. Una delle prime strategie proposte è la valutazione di un costo marginale, anche noto come congestione. Si considera che su ogni arco ogni utente deve pagare un costo (tempo) aggiuntivo, pari al ritardo dovuto alla presenza di altri utenti su tale arco. Molti decenni dopo, alcuni ricercatori, utilizzando tale strategia, sono riusciti a scoprire che, sotto alcune assunzioni, è possibile far fronte all’inefficienza del routing, scegliendo appropriatamente gli archi della rete.

  30. Routing egoistico della rete • Caratteristiche di Internet • Le reti sono formate da nodi dislocati in modo eterogeneo nel mondo e sono caratterizzate da un’architettura aperta che gli permette una continua e incontrollata crescita; • gli utenti della rete si comportano,generalmente, in maniera “egoistica” (selfish agents); • il tempo di attesa per un collegamento è dipendente dal carico del link (congestione della rete);

  31. Routing egoistico della rete • Modellizzazione del problema E’ chiaro che un sistema del genere può essere ben modellato utilizzando la teoria dei giochi. giocatori utenti della rete azioni possibili percorsi attraverso cui gli utenti possono trasmettere il proprio traffico • Assunzioni: • tutti gli utenti agiscono in modo del tutto egoistico; • il traffico di un utente è inoltrato tutto su di uno stesso percorso e contemporaneamente; • ogni utente controlla una frazione trascurabile dell’intero flusso.

  32. Routing egoistico della rete-Modello • Modello di una rete • Un grafo diretto G = (V,E); • k coppie origine-destinazione ; • ammontare deltraffico da , i = 1,2, ...,k; • un insieme di cammini da ; • un insieme ; • per ogni arco con traffico , una funzione di latenza ;

  33. Routing egoistico della rete-Modello • è non negativa, differenziabile e non decrescente; • un vettore di flusso = quantità di traffico del tratto in ; • per ogni arco il flusso ; • un flusso si dice ammissibile se per ogni i: • chiamiamo la tripla un’ istanza.

  34. Routing egoistico della rete-Modello • La latenza di un cammino risulta essere: • il costo di tutti i flussi = latenza totale, risulta: • Flussi e Teoria dei giochi • flusso la moltitudine di agenti non cooperativi • latenza totale funzione (o benessere) sociale

  35. Routing egoistico della rete-Modello • Esempio: Una unità di traffico deve andare da s a t il ritardo dipende dalla congestione 1/2 s t 1/2 nessun effetto di congestione Ognuno dei due cammini porta metà del traffico complessivo.

  36. Routing egoistico-”Paradosso di Braess" • Esempio: “Paradosso di Braess”(1968) • Sia s un quartiere, t una stazione ferroviaria. Due conducenti vogliono andare e tornare da s a t. • Per il momento, assumiamo che ci siano due rotte che non interferiscono tra loro, ognuna comprendente una strada lunga e larga, e una corta e stretta. Per simmetria, ci aspettiamo che ognuno dei due cammini porti metà del traffico complessivo, cosicché tutti i conducenti impiegano 90 minuti (1,5) per viaggiare da s a t.

  37. Routing egoistico-”Paradosso di Braess" v 1 Latenza= 1+0.5 =1.5 x 1/2 0 s t 1/2 1 x w Supponiamo ora, con l’obiettivo di diminuire i tempi, di poter introdurre una strada molto corta e molto larga che collega direttamente i punti intermedi delle due strade, con funzione di latenza nulla(indipendente dalla congestione della strada).

  38. Routing egoistico-”Paradosso di Braess" Come reagiscono i conducenti? Ogni conducente può risparmiare 30 minuti di viaggio (assumendo che gli altri utenti non cambino rotta), seguendo il cammino s → v → w → t. Supponiamo che tutti i conducenti, volendo usare la nuova strada, devino i loro cammini precedenti, per seguire il cammino s → v → w → t. v x 1 Latenza = 1+1 =2 0 s t 1 x w

  39. Routing egoistico-”Paradosso di Braess" A causa della forte congestione sui tratti (s, v) e (w, t), tutti i conducenti impiegano 2 ore per andare e tornare da s a t. Inoltre questa congestione implica che nessuno dei due cammini precedenti risulti essere migliore, in questo modo nessuno dei conducenti è incentivato a cambiare strada. Ancora peggio, ogni altro modello di traffico è instabile: tutti i conducenti sarebbero incentivati a cambiare cammino. E’ quindi ragionevole aspettarsi che tutti i conducenti seguano il cammino s → v → w → t e chequindi impieghino 30 minuti in più(0.5) del modello originale. Ne segue:

  40. Routing egoistico della rete-Flussi di Nash • Flussi di Nash • Definizione Un flusso ammissibile per l’istanza è a Equilibrio di Nash se per ogni e , , dove se se altrimenti

  41. Routing egoistico della rete-Flussi di Nash • Principio di Wardrop • Lemma Un flusso ammissibile per l’istanza è a Equilibrio di Nash se e solo se per ogni e , con , vale In particolare, tutti i cammini a cui la assegna quantità positiva di flusso hanno la stessa latenza, si indica con .

  42. Routing egoistico della rete-Flussi di Nash • Proposizione Se è un flusso a Equilibrio di Nash per l’istanza , allora

  43. Routing egoistico della rete-Flussi ottimali • Flussi ottimali • Un flusso ottimale è un flusso che minimizza la latenza totale. • Programmazione Convessa • s.a. • dove

  44. Routing egoistico della rete-Flussi ottimali • Soluzione (flusso ottimale) • La funzione obiettivo è convessa, ottimo locale = ottimo globale; • Siano Lemma 1 Un flusso è ottimale per un programma convesso della forma(NPL) se e solo se per ogni e ,con vale

  45. Routing egoistico della rete-Flussi ottimali • Interpretazione di Beckmann Corollario Sia un’istanza con funzione convessa per ogni arco , con costo marginale . Allora un flusso ammissibile per è ottimale se e solo se è un flusso di Nash per l’istanza .

  46. Routing egoistico della rete-Equilibri di Nash • Esistenza di Equilibri di Nash Lemma Un’ istanza , con funzione di latenza continua, non decrescente, ammette un flusso ammissibile di Nash. Inoltre, se sono flussi di Nash, allora

  47. Routing egoistico della rete-Prezzo dell’anarchia • Il prezzo dell’ anarchia nella rete • Definizione Per un’ istanza con un flusso ottimale e un flusso di Nash , il prezzo dell’anarchia • limite superiore buono ma non ottimo • Corollario: se , con , allora

  48. Routing egoistico della rete-Prezzo dell’anarchia • Corollario: se con intero positivo e reali non negativi, allora Es. • Osservazione In particolare, questo corollario afferma che in un’istanza con funzione di latenza lineare (cioè ogni funzione di latenza ha la forma con ), il costo di un flusso di Nash è al più il doppio del costo del flusso di minima latenza.

  49. Routing egoistico della rete-Prezzo dell’anarchia • Risultati Bicriteri • Teorema • Se è un flusso di Nash per e è ammissibile per , allora • Teorema • Se è un flusso di Nash per e è ammissibile • per , allora

  50. Routing egoistico della rete-Prezzo dell’anarchia Per ogni arco * denotiamo la funzione del costo marginale • Altri risultati per funzioni di latenza lineari • Lemma Sia un’istanza con funzioni di latenza per ogni . Allora • un flusso èdi Nash in se e solo se per ogni coppia i sorgente-destinazione e con ,

More Related