460 likes | 641 Views
Truthful and Near-Optimal Mechanism Design via Linear Programming. Ron Lavi – Chaitanya Swamy. Strumenti della Teoria dei Giochi per l’Informatica A.A. 2009/2010 Annibale Panichella. Mechanism Design. un insieme di giocatori un insieme di possibili outcomes
E N D
Truthful and Near-Optimal Mechanism Design via Linear Programming Ron Lavi – ChaitanyaSwamy Strumenti della Teoria dei Giochi per l’Informatica A.A. 2009/2010 Annibale Panichella
Mechanism Design • un insieme di giocatori • un insieme di possibili outcomes • un insieme di valutazioni private per ogni giocatore • una funzione di valutazione con • una funzione di scelta sociale • un vettore di pagamenti con • una funzione utilità
Mechanism Design ASSUNZIONI • I giocatori sono egoisti • ogni giocatore cerca di massimizzare la propria utilità • un giocatore mente se e solo se mentendo aumenta la sua utilità • Principio di rivelazione diretta • ogni giocatore rivela un proprio valore OBIETTIVO che spinga i giocatori a rivelare il proprio vero valore Funzione di scelta sociale = + Meccanismo Pagamenti
Mechanism Design DEFINIZIONE Un meccanismo deterministico è compatibile agli incentivi se • per ogni giocatore i • dove è la valutazione vera di i si ha che qualunque siano le valutazioni degli altri giocatori L’utilità ottenuta dal giocatore i nel caso in cui dice il vero L’utilità ottenuta dal giocatore i nel caso in cui dice il falso
Mechanism Design PROBLEMATICHE • Il problema su cui si intende definire una funzione di scelta sociale è un problema NP-hard • L’algoritmo che implementa la funzione di scelta sociale è un algoritmo non polinomiale • Non tutti gli algoritmi portano a meccanismi compatibili agli incentivi
Es.: Asta Combinatoria item indivisibili giocatori • m un insieme di item indivisibili da vendere • n un insieme di giocatori che competono per appropriarsi di un sottoinsieme degli item • il giocatore i ha una funzione di valutazione per ogni sottoinsieme degli item S, che gode delle seguenti proprietà: • vi(Ø)=0 • è non decrescente: per Maggiore è il numero di item aggiudicati da i e maggiore è la sua valutazione
Es.: Asta Combinatoria OBIETTIVO Problema di Social-Welfare Maximization (SWM): vogliamo calcolare un’allocazione di item (S1 ,…, Sn) da distribuire tra i giocatori, tale che • massimizzi il social welfare item indivisibili giocatori PROBLEMI • SWM è un problema NP-hard • hanno lunghezza esponenziale: risolvere esattamente SWM può richiedere un numero esponenziale di comunicazioni
Es.: Asta Combinatoria Mechanism Design e Asta Combinatoria • Definire un meccanismo • La funzione di scelta sociale ƒ è la funzione SWM e va calcolata sui veri valori dei giocatori che non sono pubblici • Ogni giocatore cerca di massimizzare la propria utilità • Il meccanismo deve essere compatibile agli incentivi OUTPUT INPUT Allocazione Valutazioni dichiarate Meccanismo Pagamenti
Meccanismi VCG DOMANDA: data la funzione di scelta sociale ƒ=SWM , esistono dei pagamenti p tali che il meccanismo è compatibile agli incentivi? RISPOSTA: Sì, i pagamenti VCG(Vickrey-Clarke-Groves) garantiscono la compatibilità agli incentivi. Qualunque funzione che non dipende dal giocatore i
Meccanismi VCG VCG richiede di calcolare la funzione di scelta sociale ƒ(v), ossia, di risolvere il problema SWM che èNP-hard E’ necessario usare algoritmi di approssimazione per calcolare la funzione di scelta sociale Il meccanismo VCG corrispondente NON è computazionalmenteefficiente VCG non funziona con tutti gli algoritmi di approssimazione
OBIETTIVO Mostreremo una tecnica generale per trasformare un algoritmo di approssimazione per problemi SWM di packing in un meccanismo probabilistico, approssimato e compatibile agli incentivi. Operazioni Condizioni necessarie Output Costruiamo un meccanismo frazionario Costruiamo un meccanismo di supporto deterministico Modelliamo il problema tramite la P. L. Intera Costruiamo un algoritmo c-approssimato Dimostriamo che l’integrality gap è al più c Otteniamo un meccanismo c-approssimato, truthful-in-expectation Finora ci siamo occupati di Meccanismi Deterministici. L’obiettivo principale di tale costruzione è quello di trasformare un meccanismo deterministico in un Meccanismo Probabilistico avente particolari proprietà.
Meccanismi Probabilistici Definizioni di Meccanismi Deterministici e di Meccanismi Probabilistici a confronto.
Meccanismi Probabilistici DEFINIZIONE Un meccanismo probabilistico è truthful in expectation (compatibile agli incentivi in aspettativa)se • per ogni giocatore i • dove è la valutazione vera di i si ha che qualunque siano le d.p. delle valutazioni degli altri giocatori Il valore atteso dell’utilità ottenuta dal giocatore i nel caso in cui dice il vero Il valore atteso dell’utilità ottenuta dal giocatore i nel caso in cui dice il falso Significato intuitivo: se tutti gli altri giocatori dichiarano il valore vero, la best response del giocatore i è di dichiarare il vero
Costruzione Generale Di seguito descriviamo una tecnica generale per ottenere i meccanismi probabilistici che siano “veritieri” (compatibili agli incentivi) in aspettativa, e che garantiscono di raggiungere una buona approssimazione di benessere sociale. Per studiare concretamente tale tecnica, vedremo come applicarla alle aste combinatorie (CA); tuttavia i risultati ottenibili non perdono di generalità, dato che la tecnica resta sempre valida per gli altri problemi di packing per i quali l’insieme delle possibili valutazioni dei singoli giocatori sono note pubblicamente e la funzione obiettivo è lineare.
Costruzione per CA Possiamo formulare il problema dell’asta combinatoria come un problema di Programmazione Lineare Intera: • dato l’insieme degli item da vendere • definiamo una variabile aleatoria xi,S per ogni coppia • giocatore i • la funzione obiettivo è se il giocatore i riceve l’insieme di item S altrimenti corrisponde alla funzione di Social Welfare
Costruzione per CA • definiamo i seguenti vincoli Ad ogni giocatore è assegnato al più un solo insieme di item S per ogni giocatore i per ogni item j Ogni item j è assegnato al più ad un solo giocatore per ogni coppia (i,S) Vincoli di interezza PROBLEMA Sfortunatamente non conosciamo un metodo matematico per risolvere il problema di programmazione lineare intera in tempo polinomiale:la P.L. Intera è un problema NP-hard!
Costruzione per CA Invece di risolvere il problema di programmazione lineare intera, risolviamo una versione rilassata del problema, per i quali conosciamo algoritmi polinomiali (ad es. il simplesso): per ogni giocatore i soggetta a vincoli per ogni item j per ogni coppia (i,S) Rilassamento continuo per ogni coppia (i,S)
P.L. Intera e P.L. Non Intera DOMANDA: che relazione c’è tra le soluzioni di un problema di Programmazione Lineare Intera e le soluzioni della sua versione rilassata? Soluzioni ammissibili della P.L. Intera Soluzioni ammissibili della P.L. NON Intera Gli ottimi dei due problemi possono essere diversi
Integrality Gap Siano: • P l’insieme dei punti della regione ammissibile; • l’insieme delle soluzioni intere ; l’integrality gapdi P è definito come Soluzione ottima del problema di P.L. frazionario Soluzione ottima del problema di P.L. intero Per i nostri scopi, ci occuperemo dei soli algoritmi di approssimazione che dimostrano un integrality gap IGP ≥ α, il che vuol dire che la soluzione ottima del problema di P.L. Intera è al massimo 1/ αvolte la soluzione ottima del suo rilassamento.
Meccanismi VGC frazionario Meccanismo VCG frazionario è così definito: • sia ƒ di scelta sociale del problema SWM • sia la soluzione ottima del problema modellato con Programmazione Lineare Frazionaria (ossia del rilassamento di P.L. Intera) • sia il vettore delle valutazioni dei giocatori • poniamo la funzione di scelta sociale frazionaria • definiamo i pagamenti dei singoli giocatori come Somma delle valutazioni degli altri giocatori j≠i È una qualsiasi funzione che non dipende da vitale che ui ≥ 0
Normalizzazione Dato un meccanismo VCG frazionario con integrality gap pari ad α≥1, possiamo definire un meccanismo VCG frazionario α-scalato nel seguente modo: VCG frazionario VCG frazionario α-scalato funzione sociale pagamenti funzione sociale pagamenti OSSERVAZIONE: dato che la funzione di valutazione dei giocatori è una funzione lineare in x , VCG frazionario α-scalato è chiaramente compatibile agli incentivi
Normalizzazione Infatti, supponiamo che il meccanismo frazionario α–scalato è compatibile agli incentivi, abbiamo che Ne deduciamo che il meccanismo frazionario α–scalato è compatibile agli incentivi se e solo se il meccanismo frazionario MF(ƒF,pF) è compatibile agli incentivi. Def. di compatibilità agli incentivi per il meccanismo frazionario non scalato
Main Decomposition Lemma Dimostreremo che dato un algoritmo Aα-approssimato che dimostra avere un integrality gap pari ad α, possiamo esprimere qualunque soluzione del problema di P.L. frazionaria come combinazione lineare convessa delle soluzioni di P.L. Intera . Per definizione di combinazione lineare convessa, vogliamo calcolare una sequenza di coefficienti λl per cui Per ogni coppia (i,S) che costituiscono la soluzione ottima del problema frazionario
Main Decomposition Lemma Riscrivendo il problema come problema di P. L. abbiamo L’intersezione tra questi due vincoli ci garantisce la ricerca di una soluzione ottima (se esiste) con valore pari a 1 Considerazioni: Le variabili xi,S sono associate alle coppie (i,S), quindi, il numero il loro è esponenziale 2n•m (dove n è il numero di Item disponibili ed m è il numero di giocatori) Il numero di vincoli è polinomiale (è pari al numero di variabili in base)
Main Decomposition Lemma Dato che tale problema non può essere risolto efficientemente, ci concentriamo sul suo problema Duale: Primale Duale
Main Decomposition Lemma Il problema duale presenta le seguenti caratteristiche Duale Le variabili wi,S possono essere viste come valutazioni Il numero di variabili è polinomiale (è pari al numero di coppie (i,S) a cui è associata una variabile xi,S* del primale che si trovano in base, cioè xi,S*>0) Il numero di vincoli è esponenziale 2n•m (dove n è il numero di Item disponibili ed m è il numero di giocatori) Corrisponde alla funzione di scelta sociale del meccanismo frazionario α-scalato.
Main Decomposition Lemma • Dalla dualità forte, si sa che il Primale ha una soluzione ottima finita se e solo se anche il suo Duale ha una soluzione ottima finita, e in questo caso i rispettivi valori delle funzioni obiettivo coincidono • Dalla dualità debole è noto che per ogni soluzione finita x del primale e y del duale, vale • Dalla proprietà dei problemi di packing, sappiamo che se
Main Decomposition Lemma Significato intuitivo: possiamo trasformare il problema duale che ha le variabili wnon vincolate, in un problema equivalente con variabiliw+≥0 PROPOSIZIONE 1 Siano Possiamo ottenere una nuova soluzione tale che DIMOSTRAZIONE Poniamo , che implica che ; dato che per la proprietà di packing anche
Main Decomposition Lemma PROPOSIZIONE 2 Siano possiamo calcolare in tempo polinomiale xl ∈Z(P) tale che DIMOSTRAZIONE Dato che il problema utilizza delle valutazioni non negative w+, abbiamo che Tuttavia, le valutazioni w+ non sono monotone. Tramite le Proposizione 1, possiamo definire delle nuove valutazioni monotone wltale che
Main Decomposition Lemma MainDecomposition Lemma Possiamo calcolare in tempo polinomiale i coefficienti λl che consentono di esprimere l’insieme delle soluzioni ottime del problema di P.L. frazionaria come combinazione lineare convessa delle soluzioni di P.L. Intera DIMOSTRAZIONE Dimostriamo che il valore ottimo del problema duale, e quindi del suo primale (dualità forte), è esattamente 1. Supponiamo per assurdo che il valore ottimo del duale è maggiore di
Main Decomposition Lemma Attraverso la Proposizione 2possiamo definire un insieme di valutazioni monotone wi,S per le xi,Sl tale che Che contraddice il vincolo del problema duale. In questo modo, abbiamo dimostrato che il valore ottimo è esattamente 1: la soluzione del problema duale restituisce i coefficienti λldi combinazione lineare convessa. Per calcolare in tempo polinomiale tali coefficienti, possiamo risolvere il problema duale mediante il metodo dell’ellissoide (che risolve qualunque istanza il problema di P.L. in tempo polinomiale).
Meccanismo di supporto deterministico Tramite il lemma precedente, possiamo esprimere la soluzione del problema di P.L. Frazionaria α-scalato , ossia , come combinazione lineare convessa della soluzione ottima del problema di P.L. Intera . • DEFINIZIONE • Un meccanismo di supporto deterministico MD sarà così costituito • la funzione di scelta sociale • i prezzi sono gli stessi del mecc. fraz. α-approssimato
Proprietà dei meccanismi MD LEMMA:il meccanismo C è compatibile agli incentivi e calcola una α-approssimazione del social welfare. DIMOSTRAZIONE: dimostriamo che MD è equivalente ad un Meccanismo VCG frazionario α-scalato e ne conserva tutte le proprietà. Per qualche il valore del giocatore i risulta essere Dato che anche i pagamenti sono α-scalati , il meccanismo MD è compatibile agli incentivi. Tale compatibilità garantisce anche una α-approssimazione Ottimo frazionario
Teorema Dato un meccanismo deterministicoMDdi supporto, compatibile agli incentivi e che calcola una α-approssimazione del social welfare con un numero polinomiale di coefficienti λj ≥ 0, possiamo ottenere in tempo polinomiale un meccanismo probabilistico MR che è veritiero (compatibile agli incentivi) in aspettativa e che calcola una α-approssimazione del social welfare Coefficienti di combinazione lineare convessa della soluzione ottima di P.L. Intera Prezzi α-scalati
Meccanismi Probabilistici A partire dal meccanismo di supporto deterministico MD è possibile costruire un Meccanismo Probabilistico MR nel seguente modo Meccanismo MR Meccanismo MD La funzione sociale è La funzione di scelta sociale ƒR è una variabile aleatoria con distribuzione di probabilità pari a ƒD La funzione sociale è Sono anche le proprietà di una funzione di probabilità secondo Kolmogorov Sono i coefficienti di combinazione convessa
Meccanismi Probabilistici Meccanismo MR Il giocatore i paga per ogni giocatore i Meccanismo MD Il giocatore i paga per ogni giocatore i I pagamenti vengono definiti in questo modo per garantire che l’utilità dei giocatori siano non negativi ui=vi-pi Variabile Aleatoria Scalare
Meccanismi Probabilistici Per il meccanismo probabilistico definito, valgono le seguenti proprietà • l’utilità Un meccanismo probabilistico MR è compatibile agli incentivi in aspettativa se e solo se il meccanismo di supporto deterministico corrispondente è compatibile agli incentivi.
Risultato Finale Il meccanismo probabilistico MR definito in precedenza è compatibile agli incentivi in aspettativa e calcola una α-approssimazione della soluzione ottima di Social Welfare Maximization in tempo polinomiale.
Ricapitolando Operazioni per costruire il Meccanismo Probabilistico • modelliamo il problema tramite P.L. Intera • risolviamo il suo rilassamento (P.L. Frazionaria) • verifichiamo l’Integrality Gap IG ≥ α • definiamo il meccanismo frazionario MF(ƒF,pF) • definiamo il meccanismo frazionario MF(ƒF,pF) α-scalato • calcoliamo i coefficienti di combinazione lineare convessa (Decomposition Lemma) tramite il metodo dell’ellissoide • definiamo il meccanismo deterministico di supporto MD(ƒD,pD) α-approssimato • definiamo il meccanismo probabilistico MR(ƒR,pR)
Esempio Vediamo come costruire un meccanismo probabilistico approssimato e “veritiero” in aspettativa per le Multi-Unit Combinatorial Auctions. • Formalmente una MUCA è così definita: • m un insieme di item indivisibili da vendere • B copie dello stesso item • n un insieme di giocatori che competono per appropriarsi di un sottoinsieme degli item • il giocatore i ha una funzione di valutazione per ogni sottoinsieme degli item S, che gode delle seguenti proprietà: • vi(Ø)=0 • è non decrescente: per
MUCA • Ogni giocatore può aggiudicarsi più copie dello stesso item • Le valutazioni di un giocatore i per due copie dello stesso item sono uguali • Se B=1 parliamo di Asta Combinatoria OBIETTIVO Problema di Social-Welfare Maximization (SWM): vogliamo calcolare un’allocazione di item (S1 ,…, Sn) da distribuire tra i giocatori, tale da massimizzi il social welfare
Costruzione di MR per MUCA A questo punto, vediamo le operazioni da effettuare per costruire un MR • modelliamo il problema di MUCA tramite P.L. Intera per ogni giocatore i per ogni item j soggetta a vincoli per ogni coppia (i,S) Ogni item ha B copie
Costruzione di MR per MUCA • risolviamo il suo rilassamento (P.L. Frazionaria) per ogni giocatore i soggetta a vincoli per ogni item j per ogni coppia (i,S) Rilassamento continuo per ogni coppia (i,S)
Costruzione di MR per MUCA • verifichiamo l’Integrality Gap Dagli studi di Algoritmi deterministici, sappiamo che la versione del problema di P.L. rilassata ha I’Integrality Gap M = # di item B = # istanze dello stesso item definiamo il meccanismo frazionario MF(ƒF,pF) la cui funzione di scelta sociale ƒF= ottimo frazionario e i pagamenti sono
Costruzione di MR per MUCA definiamo il meccanismo frazionario MF(ƒF,pF) • Grazie al Main Decomposition Lemma sappiamo che le soluzioni frazionarie di P.L. possono essere scritte come combinazione lineare convessa delle soluzioni di P.L. intera calcoliamo i coefficienti di combinazione lineare convessa {λl} tramite il metodo dell’ellissoide in tempo polinomiale.
Costruzione di MR per MUCA Definiamo il meccanismo deterministico di supporto • A partire dal meccanismo deterministico di supporto, definiamo il corrispondente meccanismo probabilistico MR(ƒR,pR) che sarà • Compatibile agli incentivi in aspettativa • Con complessità polinomiale