E N D
1. Juegos repetidos(una aproximación) Motivación: el dilema del prisionero repetido
3. (Recordatorio)
Melvin Dresher y Merrill Flood (matemáticos de la RAND) diseñaron un experimento el mismo día que tuvieron noticia del concepto de Nash.
El juego sujeto a experimentación era una versión abstracta, no interpretada, del dilema del prisionero (la historia la puso A. Tucker).
‘El juego se repitió cien veces con los mismos dos jugadores (colegas de los autores), y lo que se observó, en contra de la predicción teórica, es que las estrategias cooperativas se jugaban bastantes veces.
4. (Recordatorio)
Nash respondió aludiendo a la diferencia entre jugar el juego en una etapa, y jugarlo repetidamente.
Y dio por sentado que cuando el juego se juega de manera repetida por los mismos jugadores, pueden entrar en juego factores que no se tienen en cuenta cuando se analizan los juegos de una etapa.
Después de habernos estado ocupando de los juegos de una etapa, en éste vamos a ocuparnos de los juegos repetidos.
5. ¿Es cierto que repitiendo el dilema del prisionero se alcanza teóricamente soluciones en las que los prisioneros cooperan? NO, si el juego se repite un número de veces finito y conocido (de antemano).
SÍ, si el número de las veces que se repite el juego es infinito o desconocido de antemano (indefinido). Con dos matizaciones:
La cooperación puede no aparecer en todos los equilibrios.
El número de equilibrios puede multiplicarse, agudizándose el problema de la multiplicidad.
6. Versiones utilizadas del dilema
7. Repitiendo el juego dos veces
DILEMA REPETIDO EN DOS ETAPAS.
En un juego repetido,
se repite un juego de una etapa,
un número de etapas (veces),
sabiendo en cada una de ellas qué han hecho los jugadores en la etapa anterior,
y recibiendo los pagos en cada etapa (o al final de ellas si el juego es finito y el horizonte conocido).
Por eso, los pagos totales se hallan sumando los pagos obtenidos en cada etapa (y, eventualmente, descontando esa suma mediante alguna tasa o factor de descuento).
8. Segunda etapa cuando en la primera se han jugado las estrategias P- P
9. Segunda etapa cuando en la primera se han jugado las estrategias P- H
10. Segunda etapa cuando en la primera se han jugado las estrategias H- P
11. Segunda etapa cuando en la primera se han jugado las estrategias H- H
12. Resolviendo la primera etapa
13. DILEMA REPETIDO
EN TRES ETAPAS
14. Tercera etapa cuando en las dos primeras se han jugado las estrategias (P;P)- (P;P)
15. Tercera etapa cuando en las dos primeras se han jugado las estrategias (P;H)- (H;P)
16. Tercera etapa cuando en las dos primeras se han jugado las estrategias (H;P)- (P;H)
17. Tercera etapa cuando en las dos primeras se han jugado las estrategias (H;H)- (P;H)
18. Como el equilibrio en la tercera etapa es H-H, con independencia de la trayectoria previa,
la segunda etapa se resuelve como antes, añadiendo los pagos (2; 2) correspondientes a la tercera etapa.
19. Ejemplo de segunda etapa: en la primera se han jugado las estrategias P-H
20. Como antes, el equilibrio en la segunda etapa es H-H, con independencia de la trayectoria previa.
La primera etapa se resuelve como en el caso bietápico, añadiendo los pagos (2; 2) y (2; 2) correspondientes a la segunda y a la tercera etapa.
21. Resolviendo la primera etapa
22. CONCLUSIÓN Si el número de etapas es finito y conocido para los jugadores,
El dilema del prisionero repetido tiene como equilibrio (en estrategias dominantes) (halcón-halcón).
23. ¿Análisis acorde con los hechos? ‘Y como en nuestro análisis del juego del ciempiés, la conclusión teórica a la que llegamos no tiene un apoyo intuitivo o empírico. Jueguen al dilema del prisionero, por ejemplo, 100 veces, y en la mayoría de los casos (con alumnos de primer curso o estudiantes de pregrado) obtendrán “cooperación” durante la mayor parte del juego.’ (Kreps, 1995, p. 466).
24. Otras variantes
del dilema del prisionero
repetido.
25. El ejemplo anterior es especialmente sencillo, porque
en cada etapa hay un solo equilibrio,
y el número de etapas es finito y conocido de antemano.
Se resuelve fácilmente aplicando el equilibrio perfecto en subjuegos.
Además, no hemos descontado los pagos futuros, (ni hemos introducido probabilidades sobre el final del juego, como en los juegos de horizonte indefinido).
26. Casos más complejos (siguiendo con el dilema del prisionero):
el dilema repetido un número infinito de etapas,
el dilema repetido un número indefinido de etapas.
27. ¿Y SI EN EL JUEGO ETÀPICO HAY MÁS DE UN EQUILIBRIO?
En ese caso, se muestra ya una de las características de los juegos repetidos:
la proliferación de equilibrios.
Esta característica se acentúa cuando los jugadores desconocen el número de etapas, o éste es infinito.
28. Ejemplo: Batalla de los sexos en dos etapas
29. Ejemplo: Batalla de los sexos en tres etapas
30. EN GENERAL Si m es el número de equilibrios en el juego etápico,
y k es el número de etapas,
entonces, el juego k-etápico admite al menos el número de equilibrios:
mk.
31. Por otro lado, Si el juego etápico admite equilibrios con amenazas increíbles, habrá equilibrios del super-juego que las incluyan.
Por eso, los equilibrios del super-juego, aunque sean combinaciones de equilibrios de etapa, pueden no ser equilibrios perfectos en subjuegos.
32. Ejemplo conocido de amenaza increíble
33. ¿Y SI EL NÚMERO DE ETAPAS ES DESCONOCIDO PARA LOS JUGADORES, O ES INFINITO?
34. Cuando el número de etapas es desconocido para los jugadores,
no hay una última etapa con un equilibrio definido.
Por ello, aunque un jugador juegue “paloma” no tiene por qué esperar que el otro le juegue necesariamente halcón.
El otro le puede jugar “paloma” esperando que él también juegue “paloma”, y los dos salen ganando.
36. Esta situación ha sido objeto de experimentos. Normalmente, se seleccionan y se hace jugar a alumnos universitarios de los primeros cursos; en lugar de realizar el juego una sola vez, se les dice que tendrán que jugar muchas veces sin un horizonte fijado a la vista. En tanto no ven surgir un horizonte, la evidencia empírica muestra que tales sujetos cooperan a menudo.’ (Kreps, 1995, p. 457).
37. ‘La explicación dada para esta falta de optimalidad a corto plazo es que en los juegos repetidos también hay un largo plazo del que preocuparse. Si, por ejemplo, el jugador 1 intenta aprovecharse del 2 en el corto plazo jugando HALCÓN en lugar de PALOMA, el jugador 2 podrá reaccionar jugando posteriormente HALCÓN en lugar de PALOMA. El jugador 1 podría percibir que hay menos que ganar optimizando en el corto plazo que a perder en el largo plazo y, por lo tanto, elige cooperar. Si el jugador 2 piensa de la misma manera, se produce la cooperación.’ (Ibidem)
38. La condición necesaria crucial Que haya posibilidad siempre de obtener ganancias futuras cooperando.
Esta condición es la que no se cumple cuando el juego se repite sólo un número finito y conocido de veces.
En la última etapa, no hay posibilidad de seguir ganando si se coopera en el futuro.
Por ello, tampoco existe esa posibilidad en la penúltima etapa,
y así sucesivamente.
39. ‘Fíjense bien que ésta no es una cooperación nacida del altruismo o del aprecio al compañero.
Ésta es una cooperación que surge a partir del propio interés que calcula los beneficios o las pérdidas que puede generar un comportamiento “elegante”.’ (Ibidem)
40. El teorema de tradición oral(folk theorem) ‘Expresado de forma aproximada, el resultado general dice que todos los pagos esperados factibles pueden ser sostenidos en un equilibrio si cada jugador tiene un pago esperado por lo menos tan grande como el que este jugador se podría auto-garantizar aún en el caso de que todos los restantes jugadores se aliaran en contra suya.’ (Kreps, 1995, p. 459).
41. El teorema de tradición oral(folk theorem) Valor minimax del jugador i:
Para cada perfil de estrategias de los demás jugadores, se identifica la mejor respuesta por parte del jugador i.
El valor minimax es la peor mejor respuesta del jugador i,
es decir, es su respuesta a la combinación de estrategias de los demás jugadores que le resulta a i menos favorable;
esa combinación de estrategias es la que jugarían los demás jugadores si se coaligaran para perjudicar a i lo más posible.
42. El teorema de tradición oral(versión algo más precisa) ‘De este modo, el enunciado del teorema de tradición oral se convierte en: para cada pago factible por encima de los valores minimax de los jugadores, existe un valor de q (el factor de descuento o la probabilidad de continuar) suficientemente próximo a 1 tal que para todos los factores de descuento o probabilidades de continuar mayores, este pago puede ser obtenido en un equilibrio de Nash.’ (Kreps, 1995, p. 461).
43. El problema de la multiplicidad de equilibrios apenas disminuye si nos circunscribimos a los equilibrios perfectos en subjuegos. Salvo por ciertos detalles técnicos, el teorema de tradición oral se mantiene para el equilibrio perfecto en subjuegos (ver Kreps, 1995, p.461).
44. Esa multiplicidad de resultados y pagos puede ser resultado de equilibrios con estrategias muy diversas.
Entre las más conocidas se encuentran
la estrategia “ojo por ojo”: empezar por una acción cooperativa y actuar después de la misma manera que el otro jugador haya jugado en la etapa anterior.
La estrategia implacable: si el otro se desvía, castigarle hasta el (inexistente) final.
Disparador: si el pago que origina la acción del otro es inferior a un nivel de disparo, el jugador juega no-cooperativamente durante una serie de etapas.
También halcón-halcón es un equilibrio de Nash en un juego repetido (la cooperación no es un resultado necesario, sólo posible).
(ver Binmore, 1994, cap. 8. Una obra clásica sobre el tema es el libro de Axelrod, 1984).
45. Para una exposición más precisa , a la vez que breve y clara, de los juegos repetidos infinita o indefinidamente,
puede verse Mas-Colell y otros (1995), pp. 417-23.
Una exposición más didáctica puede encontrarse en Dixit y Skeath, 1999,
cap. 8