550 likes | 732 Views
UNIVERSIDAD COMPLUTENSE DE MADRID D epartamento de Fundamentos del Análisis Económico I. Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006. Equilibrio de Nash. (s i * ,s -i * ) es un EN en estrategias puras si y sólo si
E N D
UNIVERSIDAD COMPLUTENSE DE MADRIDDepartamento de Fundamentos del Análisis Económico I Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006
Equilibrio de Nash • (si*,s-i*)es un EN en estrategias puras si y sólo si Ui(si*,s-i*) Ui(si,s-i*), si Si, i=1,...,n
Equilibrio de Nash: mejor respuesta Nótese que cumple las siguientes propiedades: (1) si* esmejor respuesta de i a la estrategia s-i. Esto es, Ui(si*,s-i) Ui(si,s-i), si Si, dado s-i Implica que esracionalizable: son las mejores respuestas a cualquier estrategia, conjetura o creencia, que cualquier individuo puede formarse sobre el comportamiento de los otros. No existen incentivos a desviarse unilateralmente (self-enforcing)
Equilibrio de Nash: compatibilidad (2) las mejor respuestas (si*,s-i*)son compatibles entre sí, que lo hace ser una situación de equilibrio sostenible. Implica que, en equilibrio, los individuos aciertan sobre las conjeturas o creencias que se forman sobre las estrategias de los otros.
Equilibrio de Nash: concepto amplio (3) Es un concepto más amplio que los cuatro conceptos de equilibrio anteriores: EEED, EEDD, EEIEED y EEIEDD. Todo equilibrio anterior, si existe, es EN. Pero no al revés (por ejemplo, la batalla de los sexos)...
Ejemplo 4: dilema de los presos JUG 2 CA CO 2 4 CA 2 0 JUG 1 0 1 CO 4 1 .
Otros ejemplo : dilema de los presos • Oligopolios • Pesca • Aranceles • Carrera armamentista • Ejemplo: dilema de los presos altruista • Otros ejemplos: autobús .
Ejemplo : carrera armamentista JUG 2 D R 1,5 2 D 1,5 0 JUG 1 0 1 R 2 1 .
Ejemplo 1: batalla de los sexos JUG 2 O B 1 0 O 4 0 JUG 1 -1 4 B -1 1 .
Otros ejemplos : batalla de los sexos • Departamentos en una empresa y uso de equipo informático • Carrera armamentística modificada .
Ejemplo : carrera armamentista modificada JUG 2 D R 3 2 D 3 0 JUG 1 0 1 R 2 1 .
Ejemplo 5bis: ciervo-liebre JUG 2 C L 2 1 C 2 0 JUG 1 0 1/2 L 1 1/2 .
Ejemplo 5: Halcón-paloma JUG 2 H P 2-k , 2-k 4 , 0 H JUG 1 0 , 4 2 , 2 P .
Ejemplo 3: Preferencias idénticas JUG 2 IZQ DCHA 1 , 1 -1 , -1 IZQ JUG 1 -1 , -1 1 , 1 DCHA .
Ejemplo 3 bis: Preferencias idénticas JUG 2 APPLE IBM 2 , 2 0 , 0 APPLE JUG 1 0 , 0 1 , 1 IBM .
Equilibrio de Nash (4) EL EN puede ser múltiple. Con la eliminación de estrategias estrictamente dominadas nunca eliminamos un EN del juego (los EN asignan una probabilidad cero a usar estrategia estrictamente dominadas). Por lo tanto, si existe un EEED ó un EEIEED (que son único), el EN es único también. Con la eliminación de estrategias débilmente dominadas podemos eliminar algún EN del juego (en ese caso, los EN eliminados asignan una probabilidad positiva a usar estrategia estrictamente dominadas). Pero si existe un EEDD ó un EEIEDD (que puede ser múltiple), éstos son EN necesariamente. Luego algún EN (de los que perduran a la eliminación) asigna probabilidad cero a estrategias débilmente dominadas.
Ejemplo 16: algún EN desaparece con EEIEDD JUG 2 I M D 0 1 -2 U 10 5 4 JUG 1 1 0 -1 D 10 5 1 .
Práctica • Demostrad formalmente: (1) Todos los EN sobreviven a la eliminación de estrategias estrictamente dominadas (2) No ocurre lo mismo con la eliminación de estrategias débilmente dominadas (3) Todo equilibrio por eliminación de estrategias débilmente dominadas es un equilibrio de Nash (EEIEDD implica EN) .
Función mejor respuesta si* esmejor respuesta de i a la estrategia s-i. Esto es, Ui(si*,s-i) Ui(si,s-i), si Si, dado s-i Definimos la función (corres.) mejor respuesta MRi(s-i) como: MRi(s-i)={si*Si : Ui(si*,s-i) Ui(si,s-i), si Si}
Equilibrio Nash • (si*,s-i*) es un EN si y sólo si: si*= MRi(s-i*) i
Ilustraciones • Modelo de oligopolio de Cournot • Modelo de oligopolio de Bertrand • Competencia electoral • Subastas
Modelo de duopolio de Cournot Dos empresas que producen producto homogéneo, compiten en cantidades. La demanda agregada es P=a-X, donde X=X1+X2 y los costes Ci=c Xi, a y c>0. El conjunto de estrategias es Xi [0,a]. Los pagos Bi(Xi,X-i) = PXi - Ci = {a- (Xi+X-i) }Xi - c Xi son: Bi(Xi,X-i)/ Xi = (a-c) - 2Xi - X-i 2Bi(Xi,X-i)/ Xi2 = - 2 < 0
Modelo de duopolio Cournot ¿Cuál es la solución?... Mejores respuestas de 1 y 2: B1(X1,X2)/ X1 = 0 (a-c) - 2X1- X2 = 0 B2(X1,X2)/ X2 = 0 (a-c) - 2X2- X1 = 0 El ENes la solución del sistema anterior: X1*= X2*= (a-c)/3
Representación: • Dibujamos las funciones de mejor respuesta (funciones de reacción) X2 (a-c) R1 (a-c)/2 EN X2* R2 X1* (a-c)/2 (a-c) X1 SOLUCIÓN: X1*= X2*= (a-c)/3 No es eficiente, puesto que (desde el punto de vista de las empresas) la solución del monopolio lo es: X=(a-c)/2 .
Práctica (1) Un duopolio, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, a-x} • Calcular el EN en el caso Ci=cix i , i=1,2 y donde a>c1>c2>0 (b) ¿Qué empresa produce más en equilibrio? (c) Calcular el efecto de un una elevación del coste de 2 .
Práctica • (1’) Un duopolio, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, 1-x} (a) calcular el EN en el caso Ci=1/2xi ,i=1,2 (b) calcular el EN en el caso Ci=1/2xi -3/4 xi2,i=1,2 .
Práctica • (1’’) Un oligopolio de n empresas, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, a-x} (a) calcular el EN en el caso Ci=cxi ,i=1,...,n .
Modelo de oligopolio de Cournot Mejores respuestas de i: Bi(Xi,X-i)/ Xi = 0 (a-c) - 2Xi- X-i = 0 Dado que hay simetría, X1 = X2 =...= Xn. El ENes: X1*= X2*=...= Xn*= (a-c)/n+1
Práctica: modelo de Bertrand • (2) Un duopolio, fijador de precios y maximizador de beneficios, que suministra productos homogéneos. La empresa que fije el precio más bajo se lleva todo el mercado. Si fijan el mismo precio, las empresas se reparte al 50% el mercado. La demanda del mercado es: x(p)=max {0, 15-p} donde p= min{p1, p2} y el coste es Ci=2xi ,i=1,2 (a) calcular el EN en el caso p es un real entre 0 y 15. (b) calcular el EN en el caso p es un entero entre 0 y 15. .
Bertrand precios enteros 2 2 3 4 5 6 7 8 9 10 11 12 0 , 0 0 , 0 0 , 0 0 ,0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 2 3 0 , 0 6 , 6 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 4 0, 12 11, 11 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 0, 0 1 5 0, 12 0, 22 15, 15 30, 0 30, 0 30, 0 30, 0 30, 0 30, 0 30, 0 0 , 0 0, 12 6 0 , 0 0, 22 0, 30 18, 18 36, 0 36, 0 36, 0 36, 0 36, 0 36, 0 7 40, 0 40, 0 40, 0 0 , 0 0, 12 0, 22 0, 30 0, 36 20, 20 40, 0 40, 0 8 0 , 0 0, 30 0, 12 0, 22 0, 36 0, 40 21, 21 42, 0 42, 0 42, 0 42, 0 9 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 21, 21 40, 0 40, 0 40, 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 0, 40 10 0 , 0 20, 20 36, 0 36, 0 11 0, 42 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 40 0, 36 18, 18 30, 0 0, 12 0, 30 15, 15 12 0 , 0 0, 22 0, 36 0, 40 0, 42 0, 40 0, 36 0, 30 13 0, 36 0, 42 0 , 0 0, 12 0, 22 0, 30 0, 40 0, 40 0, 36 0, 30 0, 22 .
Equilibrio de Nash: existencia Teorema de Nash (1950) en estrategias mixtas En todo juego en forma normal o estratégica G ={1,...,n; S1,...,Sn;U1,...,Un} con un número de jugadores finitos y de estrategias finito en Si , i, existe al menos un equilibrio de Nash en estrategias mixtas. Demostración : se basa en el teorema del punto fijo sobre correspondencias de buen comportamiento, Kakutani (1941). Será enunciado más tarde, cuando generalicemos el teorema anterior.
Estrategias mixtas Definimos una estrategia mixta del jugadori como un vector de probabilidades pi definidas sobre todas las estrategias puras disponibles si Si. pi* esla mejor respuesta en estrategias mixtas a la estrategia mixta p-i, si y sólo si, alcanza la mayor utilidad esperada. Esto es, pi*Ui(pi*,p-i) piUi(pi,p-i), pi sobre si Si, i=1,...,n; dado p-i sobre s-i
Equilibrio de Nash en estrategias mixtas • (pi*,p-i*)es un EN en estrategias mixtas si y sólo si pi*Ui(pi*,p-i*) piUi(pi,p-i*), pi definida sobre si Si, i=1,...,n pi* esuna mejor respuesta en estrategias mixtas del jugador i y existe compatibilidad. Ejemplos: juego de las monedas y batalla de los sexos
El juego de las monedas JUG 2 CA CR 1 , -1 -1 , 1 CA JUG 1 -1 , 1 1 , -1 CR .
El juego de las monedas • SOLUCION: subrayamos las mejores respuestas NO HAY EQUILIBRIO DE NASH en estrategias puras DEBE EXISTIR AL MENOS UNO en estrategias mixtas JUG 2 CA CR 1 , -1 -1 , 1 CA JUG 1 -1 , 1 1 , -1 CR .
El juego de las monedas Definimos la estrategia mixta del jugador 1 como (p,1-p) sobre (CR,CA) y la estrategia mixta del jugador 2 como (q,1-q) sobre (CR,CA), p y q. Veamos la utilidad esperada del jugador 2 de adoptar CA ó CR, dada la estrategia mixta del jugador 1 como (p,1-p) sobre (CR,CA): UECA2 = p(1)+(1-p)(-1)=2p-1 UECR2 = p(-1)+(1-p)(1)=1-2p Veamos la utilidad esperada del jugador 1 de adoptar CA ó CR, dada la estrategia mixta del jugador 1 como (q,1-q) sobre (CR,CA): UECA1 = q(-1)+(1-q)(1)=1-2q UECR1 = q(1)+(1-q)(-1)=2q-1 Las dibujamos, para determinar las mejores respuestas en estrategias mixtas...
UE1 UE2 UECR2 UECA1 UECA2 UECR1 1 1 p q 0 0 1 1 1/2 1/2 -1 -1 El juego de las monedas • Maximizamos la utilidad esperada en estrategias mixtas de los dos jugadores EN VERDE RAYADA: las UE máximas (mejores respuestas) para cada estrategia mixta del contrario .
ü ý þ ü ý þ q < 1/2 p < 1/2 p=0 q=1 p[0,1 q[0,1 q = 1/2 p = 1/2 q > 1/2 p > 1/2 p=1 q=0 El juego de las monedas Las correspondencias de mejores respuestas en estrategias mixtas: R2(p)= R1(p)=
El juego de las monedas • Dibujamos las correspondencias de mejores respuestas en estrategias mixtas EN ROJO: las del JUG 1. EN AZUL: las del JUG 2 LA SOLUCIÓN: (p*, q*)=(1/2, 1/2) Los jugadores randomizan sus estrategias al 50% y obtienen un pago de (0, 0) CR, CR CA,CR 1 q 1/2 0 1/2 0 1 CA,CA CR, CA p .
La batalla de los sexos JUG 2 B O 4 , 1 0 , 0 B JUG 1 -1 , -1 1 , 4 O .
La batalla de los sexos • Dibujamos las correspondencias de mejores respuestas en estrategias mixtas EN ROJO: las del JUG 1. EN AZUL: las del JUG 2 SOLUCI0NES: Las dos estrategias puras más una mixta (p*, q*)=(1/6, 5/6). Los jugadores randomizan sus estrategias al 16,7% y 83,3% obtienen un pago de (0.66, 0.66) que no es eficiente O,O B,O 1 5/6 q 0 1/6 0 1 B,B O,B p .
Equilibrio de Nash: punto fijo de correspondencias de mejor respuesta • Definimos la correspondencia de mejor respuesta del jugador i Ri: s si* sS De esta forma: si* = Ri (s) s =(si,s-i)S, tal que: Ui(si*,s-i) = maxUi(si,s-i), si Si • Para todo i=1,...,n; la correspondencia demejor respuesta será: R: s s* sS donde s*=(s1*,...,sn*)
Equilibrio de Nash: punto fijo de correspondencias de mejor respuesta • Definimos el equilibrio de Nashs*=(s1*,...,sn*) como R: s*s* o lo que es lo mismo: s* = R (s*) • Esto es lo que se conoce como un punto fijo de la correspondencia de mejor respuesta R(s)
Ilustración: caso de una variable • En el caso de que s sea una variable. Un punto fijo sería: R(s) R(s*) 45º s* s .
Teorema de Kakutani (1941): existencia de puntos fijos de correspondencias • Establece las condiciones suficientes que garantizan la existencia de un punto fijo de correspondencias • Si el conjunto S es compacto (acotado y cerrado) y convexo y R(s) es una correspondencia hemi-contínua superior y convexa para todo s, existe siempre un punto fijo (y por tanto un EN)
Ilustración: caso de una variable • Caso de S compacto y convexo y una correspondencia R(s) hemi-contínua superior, pero no convexa para todo s: • No se garantiza la existencia de un punto fijo. R(s) 45º s .
Teorema de Nash: generalización Teorema de Nash (1951) en estrategias contínuas En todo juego en forma normal o estratégica G ={1,...,n; S1,...,Sn;U1,...,Un} donde el conjunto de estrategias es compacto y convexo y donde las funciones de pagos es contínua en S y cuasi-cóncava en si,existe al menos un equilibrio de Nash. Demostración : aplicación del teorema del punto fijo sobre correspondencias de Kakutani (1941). Si la función de pago es contínua, R(s) es hemi-contínua superior y si la función de pagos es cuasi-cóncava en si, R(s) es convexo para todo s. Generalización : el teorema en estrategias mixtas es un caso particular, donde el conjunto de estrategias es compacto y convexo y la función de pagos lineal en si (por lo tanto, cuasi-cóncava)
Teorema de Nash: generalización Demostración : aplicación del teorema del punto fijo sobre correspondencias de Kakutani (1941). Si la función de pago es contínua, R(s) es hemi-contínua superior y si es cuasi-cóncava en si , R(s) es convexo para todo s.
Cuasi-concavidad de función de pagos DEF: F pagos Ui (si,s-i) cuasi-cónvava en si si y sólo si, dados cualquier s1 y s2, tales que Ui (s1,s-i) = Ui (s2,s-i) y [0,1], entonces: Ui (s1+(1-) s2,s-i) Ui (s1,s-i) = Ui (s2,s-i) PROPOSICIÓN: Si la función de pago es cuasi-cóncava en si , R(s) es convexo para todo s. PRUEBA: Si R(s) es no convexa: dadas s1 y s2 Ri(s) dos mejores respuestas de s, entonces s1+(1-) s2 Ri(s), [0,1] Por lo que, Ui (s1+(1-) s2,s-i) < Ui (s1,s-i) = Ui (s2,s-i) Esto contradice la cuasi-concavidad de la función de pagos en si
Práctica • (3) Dos empresas fijadoras del precio producen dos bienes sustitutos cercanos, con demandas: x1(P1,P2)= a-P1 +bP2 x2(P1,P2)= a-P2 +bP1 (a) calcular el EN en el caso Ci=cxi ,i=1,2 y b>0 .