200 likes | 420 Views
Intelligenza Artificiale. Preferenze. Outline. Preferenze razionali Utilità Denaro Utilità multi-attibuto Reti di decisione Valore dell’informazione. Preferenze. Un agente sceglie tra premi (A, B, etc.) e lotterie, cioè, situazioni con premi incerti Lotteria L = [p, A; (1-p), B]. A.
E N D
Intelligenza Artificiale Preferenze Slides Intelligenza Artificiale, Vincenzo Cutello
Outline • Preferenze razionali • Utilità • Denaro • Utilità multi-attibuto • Reti di decisione • Valore dell’informazione Slides Intelligenza Artificiale, Vincenzo Cutello
Preferenze Un agente sceglie tra premi (A, B, etc.) e lotterie, cioè, situazioni con premi incerti Lotteria L = [p, A; (1-p), B] A p L 1-p B Slides Intelligenza Artificiale, Vincenzo Cutello
Preferenze razionali Idea: le preferenze di un agente razionale devono obbedire a vincoli. Preferenze razionali comportamento descrivibile come massimizzazione dell’utilità attesa Slides Intelligenza Artificiale, Vincenzo Cutello
Preferenze razionali (cont.) La violazione dei vincoli conduce a evidenti contraddizioni Per esempio: un agente con preferenze intransitive può essere indotto a dare via tutto il suo denaro Slides Intelligenza Artificiale, Vincenzo Cutello
Massimizzando l’utilità attesa Teorema (Ramsey, 1931; von Neumann e Morgenstern, 1944): Date le preferenze soddisfacenti i vincoli esiste una funzione a valori reali U tale che Principio MEU: Scegliere l’azione che massimizza l’utilità attesa Nota: un agente può essere interamente razionale (consistente con MEU) senza mai rappresentare o manipolare utilità e probabilità Es., una tabella predefinita per un giocatore perfetto di tris Slides Intelligenza Artificiale, Vincenzo Cutello
Utilità L’utilità associa gli stati a numeri reali. Quali numeri ? Approccio standard per stabilire l’utilità umana: Comparare un dato stato A con una lotteria standard Lp che ha: “miglior premio possibile” u^ con probabilità p “peggiore catastrofe possibile” u^ con probabilità (1-p) Aggiustare la probabilità della lotteria p fino a quando A è indifferente rispetto a Lp Continua come prima 0.999999 Pagare 30 € è indifferente a L 0.000001 Morte istantanea Slides Intelligenza Artificiale, Vincenzo Cutello
Scale di utilità Utilità normalizzate: u^ = 1.0, u^ = 0.0 • Micromorts: un milionesimo della possibilità di morire • utile per la roulette russa, pagamento per ridurre i rischi prodotti, etc., • QALYs: quality-adjusted life years • Utile per decisioni mediche comportanti un rischio sostanziale Note: il comportamento è invariante per trasformazioni lineari U’(x) = k1U(x) + k2 dove k1 > 0 Slides Intelligenza Artificiale, Vincenzo Cutello
Denaro • Il denaro non si comporta come una funzione di utilità • Data una lotteria L con valore monetario atteso di EMV(L), solitamente U(L) < U(EMV(L)), cioè, le persone sono avverseal rischio • Curva di utilità: per quale probabilità p sono indifferente tra un premio fisso x e una lotteria [p, € M; (1-p), € 0] per un grande M ? • I dati si possono (o debbono estrapolare sperimentalmente) Slides Intelligenza Artificiale, Vincenzo Cutello
Paradosso di S. Pietroburgo • Vi viene chiesto di partecipare ad un gioco in cui una moneta viene lanciata in aria sino a quando il risultato non è “testa”. • Se “testa” compare al lancio “n” , il giocatore vince € 2n. • Quanto paghereste per giocare ? • EMV(S.P.)= • Disposto a pagare qualunque cifra ? Assurdo. Bernoulli (1738) propose di misurare l’utilità del denaro su scala logaritmica: • Quindi per giocare un agente razionale paga sino a € 4 ! Slides Intelligenza Artificiale, Vincenzo Cutello
Reti di decisione • Aggiungere nodi di azioni e nodi di utilità alle reti di credenza per prendere decisioni razionali • Algoritmo: • for ogni valore del nodo di azione • calcolare il valore atteso dell’utilità del nodo data l’azione e la prova • return l’azione MEU Slides Intelligenza Artificiale, Vincenzo Cutello
Utilità multiattributo • Come possiamo gestire l’utilità di funzioni a più variabili X1,…,Xn ? • Esempio, per la costruzione di un aeroporto, parametri: pericoli, rumori, costo di costruzione • qual è U(Pericoli, Rumore, Costo) ? • Come possono essere determinate le funzioni di utilità complesse dal comportamento delle preferenze ? • Idea 1: identificare le condizioni sotto le cui decisioni possono essere fatte senza la completa identificazione di U(x1,…,xn) • Tipicamente definire attributi tale che U è monotona in ogni parametro. Slides Intelligenza Artificiale, Vincenzo Cutello
Dominanza stretta • La scelta B domina strettamente la scelta A se e solo se • per ogni parametro i, Xi(B) ≥ Xi(A) (e quindi U(B) ≥ U (A) ) • La dominanza stretta si riscontra raramente nella pratica Slides Intelligenza Artificiale, Vincenzo Cutello
Dominanza stocastica Slides Intelligenza Artificiale, Vincenzo Cutello
Dominanza stocastica • La dominanza stocastica può essere spesso determinata senza le distribuzioni esatte usando ragionamenti qualitativi • Es., i costi di costruzione aumentano con la distanza dalla città. Quindi • se S2, è più lontano dalla città rispetto a S1ne deriva che • S1 domina stocasticamente S2 sui costi Slides Intelligenza Artificiale, Vincenzo Cutello
Struttura di preferenza: deterministico X1 and X2 sono preferenziabilmente indipendenti (P.I.) da X3 se e solo se la preferenza tra <x1,x2,x3> and <x’1,x’2,x’3> non dipende da x3 Es., <Rumore, Costi, Sicurezza>: <20,000 soffrono, $4.6 miliardi, 0.06 morti/mpm> contro <70,000 soffrono, $4.2 miliardi, 0.06 morti/mpm> Teorema (Leontief, 1947): se ogni coppia di attributi è P.I. dal suo complemento, allora ogni sottoinsieme di attributi è P.I. dal suo complemento: P.I. mutuale Teorema (Debreu, 1960): P.I. mutuale ⇒ esiste una funzione di valutazione additiva : V(S)=∑iVi(Xi(S)) Quindi bisogna determinare n funzioni con singolo attributo; spesso una buona approssimazione Slides Intelligenza Artificiale, Vincenzo Cutello
Struttura di preferenza: Stocastica • Abbiamo bisogno di considerare le preferenze sulle lotterie: • X è indipendente dall’utilità di Y se e solo se • le preferenze sulle lotterie X non dipendono da y • U.I. mutuale: ogni sottoinsieme è U.I. dal suo complemento • Sotto tale ipotesi: esiste una funzione di utilità moltiplicativa: • U=k1U1+k2U2+k3U3+k1k2U1U2+k2k3U2U3+k3k1U3U1+k1k2k3U1U2U3 • Procedure di routine e pacchetti software per generare test di preferenza per identificare varie famiglie canoniche di funzioni di utilità Slides Intelligenza Artificiale, Vincenzo Cutello
Valore dell’informazione • Problema calcolare il valore di acquisire nuovi elementi decisionali. • Può essere fatto direttamente dalla rete di decisione • Esempio: comperare dei diritti petroliferi • n blocchi A1, …, An, solo in uno è presente il petrolio, valore stimato k • Probabilità a priori 1/n ognuno, mutuamente esclusivi • Il prezzo corrente di ogni blocco è allora k/n • Il consulente offre una perizia sul blocco A1. Costo della consulenza ? • Soluzione: calcolare il valore atteso dell’informazione = • valore atteso della miglior azione data l’informazione meno il • valore atteso della miglior azione senza l’informazione • Potremmo dire “petrolio in A1” o “niente petrolio in A1”, con probabilità rispettivamente 1/n e (n-1)/n, • [1/n * valore di “comprare A1” dato “petrolio in A1” + • (n-1)/n * valore di “comprare un altro lotto” dato “niente petrolio in A1” ] – 0 • = Slides Intelligenza Artificiale, Vincenzo Cutello
Formula generale Slides Intelligenza Artificiale, Vincenzo Cutello
Proprietà del VPI Slides Intelligenza Artificiale, Vincenzo Cutello