300 likes | 807 Views
Tema 5. Juegos secuenciales con información perfecta. 5.1 Juegos secuenciales o dinámicos. 5.2 La descripción extensiva: el árbol de decisión de un juego. 5.3 Estrategias y planes de acción. 5.4 Jugadas estratégicas. 5.5 El principio de racionalidad secuencial y las amenazas creíbles.
E N D
Tema 5. Juegos secuenciales con información perfecta. 5.1 Juegos secuenciales o dinámicos. 5.2 La descripción extensiva: el árbol de decisión de un juego. 5.3 Estrategias y planes de acción. 5.4 Jugadas estratégicas. 5.5 El principio de racionalidad secuencial y las amenazas creíbles. 5.6 La inducción hacia atrás y el Equilibrio Nash Perfecto. Aplicaciones:Un modelo de inspección secuencial. La asignación de un bien indivisible: juicio del rey Salomón. Duopolio a la Stackelberg. Bibliografía básica: Olcina y Calabuig: Cap. 6. Bibliografía complementaria: Gardner: cap. 6. Gibbons: cap. 2. Dixit y Nalebuff: caps. 2, 5, 6.
5.1Juegos secuenciales o dinámicos. En muchas situaciones estratégicas los jugadores no toman sus decisiones ignorando completamente las decisiones de sus oponentes. Una situación de interacción estratégica es un juego secuencial o dinámico si al menos un jugador conoce algo sobre las decisiones de otro jugador en algún momento del juego en el que le corresponda tomar una decisión. En estos juegos existe una secuencia o turno establecido de movimientos entre los jugadores y las reglas del juego permiten que al menos uno de ellos tenga información (perfecta o imperfecta) sobre las decisiones previas tomadas cuando es su turno de jugar. Juegos de cartas, ajedrez, etc..
Luego, a diferencia de los juegos simultáneos, deberemos explicitar el orden en que toman sus decisiones los jugadores, así como la información que tiene cada uno de ellos al llegarles su turno. En estos juegos nos centraremos en situaciones con información completa, : aquellas en las que la estructura del juego, los pagos y la motivación de los jugadores (es decir, que son maximizadores de utilidad) son conocimiento público. Definición: Un juego secuencial es de información perfecta si todos los jugadores están completamente informados acerca de las decisiones previas de todos sus oponentes en cada punto del juego en que le corresponda adoptar una acción. Ejemplos: ajedrez y las damas. En microeconomía, un juego de información perfecta bien conocido es el llamado duopolio a la Stackelberg
A la secuencia de acciones adoptadas por los jugadores previa a un momento particular del juego en que algún jugador debe decidir la denominaremos historia del juego. Un juego de información perfecta es pues aquél en que los jugadores conocen siempre la historia previa completa. *Ajedrez * En el llamado duopolio a la Stackelberg: una empresa (líder) elige su nivel de producción, entonces la otra empresa (seguidora) tras observar el nivel de producción elegido por la empresa líder, decide su nivel de producción.
Ejemplo 1: ¿Me porto bien o mal? Un niño (N) debe decidir si portarse bien o mal (acciones B y M respectivamente). El padre (P), a la vista de la conducta de su hijo debe decidir, si se comporta mal, si castigarle o no castigarle (acciones C y NC, respectivamente). Si el hijo se porta bien, el resultado preferido por el padre, le supone unos pagos (“psicológicos”) al padre de 2, mientras que al hijo solo de 1. Si el niño se porta mal y el padre no lo castiga, le proporcionan los mayores pagos al hijo, 2, mientras que solo de 1 al padre. Si el hijo se porta mal y el padre lo castiga, se obtienen los peores pagos para el hijo (es castigado) y para el padre (se siente culpable), supondremos que ambos tienen un pago de cero.
Ejemplo 2: Reparto de 3 objetos indivisibles. Dos individuos deben repartirse 3 objetos indivisibles. El jugador 1, debe proponer un reparto de estos objetos, pero con la restricción de que ningún jugador se puede quedar sin ningún objeto. A la vista de la propuesta de reparto, el jugador 2, debe decidir si acepta esta propuesta o no. Si la acepta, cada jugador se queda con el número de objetos recogidos en la propuesta. Si rechaza la propuesta, ambos jugadores se quedan sin nada. Los jugadores deciden secuencialmente
5.2 La descripción extensiva de un juego secuencial: el árbol de decisión de un juego. • La descripción (llamada también forma) extensiva de un juego secuencial con información perfecta tiene tres componentes: • La descripción completa de todas las posibles secuencias de acciones que pueden ocurrir desde el principio hasta el final del juego. A estas secuencias se les denomina también historias o sendas del juego. • La especificación de qué jugador tiene el turno de decisión en cada punto del juego. • Las preferencias (o pagos) de los jugadores sobre los resultados finales del juego, asociados a dichas secuencias completas o historias.
En algunos juegos secuenciales con información perfecta describir las secuencias de acciones o historia es una tarea imposible debido a su inmensa complejidad, como por ejemplo, en el ajedrez. Sin embargo, en otras situaciones es muy sencillo: ¿Me porto bien o mal? Primera historia: El niño se porta bien, (en este caso, el padre no tiene que tomar ninguna decisión) Segunda historia: El niño se porta mal y el padre lo castiga. Tercera historia: El niño se porta mal y el padre no lo castiga Cada una de estas secuencias da lugar a uno de los tres posibles resultados finales. En la primera, los pagos son (1,2), donde el primer componente se refiere al niño y el segundo al padre. En la segunda los pagos son (0,0) y en la tercera, (2,1).
El árbol de decisión de un juego recoge estos tres componentes. En concreto, un árbol consta de: nodos de decisión(puntos del juego en que un jugador puede tener que decidir), ramas(acciones de que dispone en cada nodo de decisión) ynodos terminales (resultados finales del juego) a los que asociamos los pagos de los jugadores.
En el ejemplo del niño existen dos nodos de decisión: • el inicial en que el niño decide entre las acciones B o M (luego, del que parten dos ramas) y • el nodo en que el padre tras la acción M debe decidir entre las acciones C y NC (luego, también con dos ramas). • Este árbol tiene tres nodos terminales que son los tres resultados del juego ya mencionados y a los que asociamos los pagos de ambos jugadores. • Representaremos gráficamente dicho árbol N pagos de los jugadores: vector columna donde el primer pago es el del jugador que mueve primero (en el ejemplo, N), el segundo el del que mueve segundo, P B M P 1 2 C NC 0 0 2 1
Ejemplo 2: Reparto de 3 objetos indivisibles. 1 (1,2) (2, 1) 2 2 N S S N 2 1 0 0 1 2 0 0
Ejemplo 2: Reparto de 3 objetos indivisibles. Ahora los nodos de decisión son tres. El jugador 1 tiene un único nodo de decisión que es el inicial, del que parten sus dos acciones, ofrecer (2,1) u ofrecer (1,2). Pero el jugador 2 tiene dos nodos de decisión, pues puede tener que decidir en dos contingencias distintas: tras observar que el jugador 1 ofrece (2,1) o tras observar que éste ofrece (1,2). En cada uno de ellos habrá dos ramas, correspondientes a sus dos acciones, decidir S o N. 1 (1,2) (2, 1) 2 2 N S S N 2 1 0 0 1 2 0 0
5.3Las estrategias y planes de acción de un jugador. El ejemplo del reparto de los 3 objetos ilustra un hecho clave en los juegos secuenciales. Si nos centramos en el jugador 2 podemos comprobar que su decisión no puede ser decir S o N. Su decisión debe ser un plan que especifique qué decidir si observara que el jugador 1 ofrece (2,1) y qué decidir si, en cambio, observara que ofrece (1,2). Sus acciones son distintas de sus estrategias y estas últimas son las realmente importantes, es decir, aquello sobre lo que los jugadores maximizadores de utilidad deben decidir. Las acciones son obviamente dos: aceptar (S) o rechazar (N).
La estrategia de un jugador es un plan completo de acción que especifica qué hacer ante todas y cada una de las situaciones en que pueda ser llamado a decidir. Una estrategia es un plan completo contingente a la información de que se dispone en cada momento. El jugador 2, aún teniendo dos acciones, dispone de cuatro posibles estrategias (puras): “si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), acepta (S).” “si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), rechaza (N).” “si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), acepta (S).” “si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), rechaza (N).”
“si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), acepta (S).” “si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), rechaza (N).” “si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), acepta (S).” “si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), rechaza (N).” Por simplificar la notación en lo que sigue denotaremos estas cuatro estrategias de la forma siguiente: {(S,S), (S,N), (N,S), (N,N)}, donde el primer elemento en cada par es que se planea votar si el jugador 1 ofrece (2,1) y el segundo si ofrece (1,2). Reparto de 4 objetos indivisibles? forma general de una estrategias? número de estrategias?
Una forma intuitiva de pensar en una estrategia es imaginarla como un conjunto de instrucciones completas que se le dejan a un delegado para que juegue en tu ausencia y en tu nombre, pero sin ninguna libertad estratégica, es decir, haciendo exactamente lo que dictan las instrucciones. Formalmente una estrategia en un juego con información perfecta no es más que una regla que especifica una acción, y sólo una, para todos y cada uno de los nodos de decisión de un jugador.
El jugador 1 sólo mueve en un nodo de decisión (el origen del juego), por lo que en este caso estrategias y acciones coinciden. Es decir, sus estrategias son acciones no contingentes al ser el primero en mover y no volver a hacerlo en todo el juego. 1 (1,2) (2, 1) 2 2 N S S N 2 1 0 0 1 2 0 0
En general, siempre que un jugador sólo posea un nodo de decisión, sus acciones y estrategias coincidirán, este es el caso para ambos jugadores en el ejemplo 1 N B M P 1 2 C NC 0 0 2 1
5.4 Jugadas estratégicas. Buscamos EN, es decir, en combinaciones de estrategias tales que la estrategia de todo jugador es mejor respuesta a las de sus oponentes En el juego del niño, tal y como ya se ha indicado, acciones y estrategias coinciden para ambos jugadores. El niño N tiene dos estrategias: B y M y el padre P también dos: C y NC. Las funciones de mejor respuesta de ambos jugadores son: fN(C) = B fN(NC) = M para el niño N; fP(B)= {C, NC} fP(M) = NC para el padre P Nótese que tanto C como NC son mejor respuesta a la acción B (portarse bien) del niño N por la sencilla razón de que en ese caso el padre no debe tomar ninguna decisión.
Es fácil comprobar que existen dos EN en estrategias puras: (B,C) y (M,NC) con pagos respectivamente de (1,2) y (2,1). (B,NC) es un equilibrio? (M, C) es un equilibrio? El EN (B,C) representa un tipo de fenómeno o posibilidad que no podía surgir en los juegos simultáneos pero que van a ocupar nuestra atención en los juegos secuenciales. Se trata de una jugada estratégica:una amenaza.
Se trata de una jugada estratégica: una amenaza. Las jugadas estratégicas en general son jugadas diseñadas para alterar las creencias y acciones de tus rivales en una dirección favorable al jugador que las realiza. Su rasgo distintivo es que los jugadores siempre limitan voluntariamente su libertad de acción. Esta falta de libertad puede tener un valor estratégico, alterando la conducta de tu oponente en una dirección favorable al jugador, siempre que aquél la conozca. Las dos jugadas estratégicas por excelencia son:
Cuando se mueve primero: • las jugadas incondicionales o compromisos previos irrevocables a una determinada acción, que conocidas por el que mueve segundo llevan a tu mejor pago cuando este aplica su mejor respuesta. • Este tipo de jugadas estratégicas, muy importantes en economía y en las relaciones sociales en general • b) Cuando se mueve segundo: • amenazas (o promesas según el caso). • Es decir, comprometerse a una regla de respuesta a las acciones del jugador que mueve primero que fuercen a éste a una conducta tal que el jugador que amenaza obtiene su mejor pago.
El EN (B,C) representa claramente una amenaza del padre al niño: “si te portas mal (acción M) , te castigaré (acción C)”. Si el niño se cree esta amenaza, su mejor respuesta es portarse bien (acción B) y dado que no se porta bien, el padre no tiene que llevar a cabo su amenaza, no suponiéndole pues ningún coste el formularla. Además, de esta forma el padre obtiene su mejor pago en el juego: 2. Sin embargo, la cuestión clave en las jugadas estratégicas, como las amenazas, es que para que estas sean efectivas deben ser creíbles. Y sólo serán creíbles si el jugador que la formula tiene los incentivos adecuados a llevarla a cabo en caso necesario.
Sin embargo, la amenaza del padre no es creíble en absoluto pues presupone que, ante el hecho consumado de que el niño se porte mal, el padre actuaría irracionalmente eligiendo la acción C que le ofrece unos pagos de 0 frente a la acción NC que le ofrece unos beneficios de 1. (olvidemos por un momento la educación de los hijos) Luego, el EN (B,C) no es razonable pues implica una fuerte dosis de irracionalidad por parte del niño, ya que cree una amenaza claramente no creíble. Con otras palabras, el niño anticipa una respuesta o conducta futura irracional (si se porta mal) de su padre, pues la acción C está dominada por la acción NC.
Por ejemplo, en el EN (B,C) la senda que se produce es B y el padre no tiene que tomar ninguna decisión. Su plan de jugar C, queda fuera de la senda de equilibrio y por ello puede planear una acción dominada como C. Ahora bien, esto no es inocuo, pues dicha amenaza de jugar C es lo que induce al niño a elegir portarse bien B. N B M Amenaza P Senda de equilibrio 1 2 C NC 0 0 2 1