100 likes | 450 Views
JUEGOS REPETIDOS. Dilema del prisionero Dilema del prisionero iterado Tras cada interacción entre los prisioneros, y una vez reveladas sus decisiones, vuelven a interactuar y los pagos que obtienen son la suma de los pagos.
E N D
Dilema del prisionero Dilema del prisionero iterado Tras cada interacción entre los prisioneros, y una vez reveladas sus decisiones, vuelven a interactuar y los pagos que obtienen son la suma de los pagos
Definición Un juego repetido se define por un juego de etapa G en forma estratégica, que se juega de forma repetida en tiempo discreto: • G = {Si, πi, i = 1,. . ., N} • con Si es el conjunto de estrategias del jugador i y πi (s1, s2, ..., Sn) su función de pagos. • Definición Si el número de repeticiones, T, es finito, el juego es un juego repetido finitamente y si el juego no tiene un fin fijo es un juego infinitamente repetido. • En juegos finitamente repetidos los pagos son la suma de los pagos en cada etapa. • En juegos infinitamente repetidos los pagos se descuentan con un factor δ: 0 <δ <1, • Interpretación del factor δ • Cada vez que se juega el juego de etapa, hay una probabilidad p de que la interacción actual sea la última (la probabilidad de que estos jugadores jueguen el juego de etapa de nuevo es δ = 1-p). Los beneficios se calculan como el pago esperado. • El pago de la etapa t + 1 se valora como una fracción δ en la etapa t. La fracción δ asociada es un factor de descuento y se valoran los beneficios como el valor actual.
El dilema del prisionero modificado en T etapas. En el dilema del prisionero modificado los prisioneros tienen también la opción de confesar parcialmente con la matriz de pagos Player 1 \ Player 2 c p n c 0, 0 3, -1 7, -2 p -1, 3 3, 3 6, 0 n -2, 7 0, 6 5, 5 Este proceso se repite T veces y los pagos son la suma de los pagos de cada etapa El juego de etapa tiene dos equilibrios • (C,C) con pagos (0, 0). • (P, P) con pagos (3, 3).
Equilibrios básicos • Ambos jugadores juegan C en cualquier caso. • Ambos jugadores juegan P en cualquier caso. • Otros equilibrios. El comportamiento de los jugadores en cada etapa depende del comportamiento observado en etapas anteriores • En dos etapas tenemos un EPS si ambos jugadores juegan con la estrategia • En la primera etapa jugar N. • Si en la primera etapa se ha jugado (N,N) jugar P. • En caso contrario jugar C. • En T etapas tenemos un EPS si ambos jugadores juegan con la estrategia: • En la primera etapa jugar N. • Si en las etapas anteriores todos los jugadores han jugado N jugar N, salvo en la ultima etapa que jugamos P. • En caso contrario jugar C.
Proposición En un juego repetido cuyo juego de etapa G = {Si, πi, i = 1,. . ., N} tiene exactamente un equilibrio de Nash, (s1*, s2*, ..., Sn*), hay un único EPS. • En este equilibrio, el jugador i si juega si* en cada una de las etapas, independientemente de lo que podría haber sido interpretado por él mismo o cualquiera de los otros, en cualquier etapa anterior • El dilema del prisionero en T etapas. • El juego de etapa tiene un único equilibrio $(C,C)$. • Los jugadores pueden jugar en todo momento como si les quedara una única etapa. • El juego completo tiene un único equilibrio: los dos jugadores confiesan siempre y en cualquier contingencia • NotaSi hay más de un equilibrio de Nash, siempre existe la posibilidad de mantener un buen comportamiento en las primeras etapas de interacción repetida. El buen comportamiento en las interacciones tempranas puede ser recompensado por el juego de mejores equilibrios de Nash en subjuegos futuros, mientras que cualquier desviación de esta conducta puede ser castigado por el juego de los malos equilibrios de Nash en subjuegosfuturos.
El dilema del prisionero iterado infinitamente. Tras cada interacción entre los prisioneros, y una vez reveladas sus decisiones, vuelven a interactuar sin fin definido Factor de descuento asociado a un interés Probabilidad p de que el juego termine
Estrategia del disparador severo (grim trigger strategy) • Jugar N en la primera etapa. • Si en las etapas anteriores los jugadores han jugado siempre N entonces jugar N. • En caso contrario jugar $C$ de ahora en adelante. • Si ambos jugadores juegan con la estrategia del disparador severo tenemos un EPS:
Estrategia del disparador con perdón (forgiving trigger strategy) • En las estrategias del tipo disparador hay un perfil de estrategias cooperativo tras el cual, si algunos de los jugadores se desvía, el jugador juega un perfil de estrategias de castigo. • Jugar $N$ en la primera etapa. • Si en todas las etapas anteriores ambos jugadores han jugado siempre N entonces jugar N. • Si algún jugador ha jugado C entonces jugar C en las T etapas siguientes y jugar N en la etapa T+1 con la estrategia en mente • Si ambos jugadores juegan con esta estrategia tenemos un EPS cuyos pagos son mayores que en el disparador severo
Un ciclo de comportamiento (behavior cycle) es una sucesión de acciones que se repite. • Jugar (N,N) T1 etapas • Jugar (C,C) T2 etapas • Jugar (N,C) T3 etapas • Jugar (C,N) T4 etapas • Tras las T=T1+T2+T3+T4 etapas repetir el ciclo • Un ciclo de comportamiento es individualmente racional si cada jugador obtiene pagos estrictamente positivos dentro del ciclo • Teorema popular (Folk theorem) • Comportamiento en equilibrio. Cualquier ciclo de comportamiento individualmente racional es factible como EPS (siempre que el factor de descuento δ es cercano a 1). • Estrategia Equilibrio. Una estrategia que constituye un equilibrio es el disparador severo: comenzar con el ciclo de la conducta deseada y continuar con él. Si cualquier jugador se desvía entonces jugar (c, c) siempre después