320 likes | 457 Views
Elementos da Teoria dos Jogos e Aplicações. Aula 5. Maio, 2005. Revisão. Principais conceitos e definições. Revisão. Jogo estático “Common knowledge” Eliminação de estratégias estritamente dominadas Equilíbrio de Nash Estratégias mistas Jogo Dinâmico Estratégia Subjogo
E N D
Elementos da Teoria dos Jogos e Aplicações Aula 5 Maio, 2005
Revisão Principais conceitos e definições
Revisão • Jogo estático • “Common knowledge” • Eliminação de estratégias estritamente dominadas • Equilíbrio de Nash • Estratégias mistas • Jogo Dinâmico • Estratégia • Subjogo • Equilíbrio de Nash Perfeito em Subjogos
Jogos Repetidos Horizonte finito e infinito Reputação e credibilidade Punições
Dilema dos Prisioneiros • Considere a seguinte versão do dilema dos prisioneiros. • Pergunta: há meios de implementar cooperação em relações duradouras?
Dilema dos prisioneiros em 2 períodos • Taxa de desconto: =1. • Expansão da árvore é exponencial: • 1o período: 4 resultados possíveis • 2o período: 16 resultados possíveis • Estratégia: deve estabelecer o que será feito por cada jogador, em cada história possível do jogo.
Indução retroativa • Menor subjogo: é o próprio jogo constituinte; independente da história pregressa. • EN do menor subjogo: (C,C).
1o período • Considerando que no segundo período será jogado (C,C), o primeiro período é representado por:
Equilíbrio de Nash Perfeito em Subjogos • Jogador i: (C; C,C,C,C) • O ENPS é único. • Não há como implementar cooperação. • Caso houvesse N períodos, o resultado seria análogo.
Proposição Caso o jogo constituinte tenha um único equilíbrio de Nash, o jogo repetido N vezes também terá um único equilíbrio de Nash perfeito em subjogos. Esse ENPS corresponde à repetição dos equilíbrios do jogo constituinte.
Cooperação em jogos com horizonte finito • Suponha que, por alguma razão, haja uma nova possibilidade no jogo constituinte, representada por X.
Sustentando cooperação • Considere o seguinte par de estratégias: • Primeiro período: NC • Segundo período: X caso tenha ocorrido (NC,NC); C caso contrário. • Objetivo: ao invés de caracterizar o conjunto de todos os equilíbrios, iremos mostrar que as estratégias acima constituem um ENPS.
Indução retroativa • 2o período: • As estratégias determinam que ambos escolham C ou ambos escolham X. • Como (C,C) e (X,X) são EN do jogo constituinte, não há problema.
Características • Só é possível implementar cooperação em jogos repetidos com horizonte finito se o jogo constituinte apresentar equilíbrios múltiplos. apenas as ameaças críveis de punições futuras podem afetar o comportamento corrente. • Caso haja um único EN no jogo constituinte, será jogado em cada repetição.
Estrutura • Jogo constituinte G. • Infinitas repetições – se aplica para relações duradouras que não possuem prazo de validade. • Taxa de desconto: 0<<1. • Impaciência. • Probabilidade do jogo se repetir por mais 1 período.
Dilema dos prisioneiros • Estratégia do gatilho: • Joga NC no 1o período; • Joga NC se observou (NC,NC) em todos os períodos anteriores e C caso contrário.
Teste • A estratégia do gatilho constitui um equilíbrio de Nash perfeito em subjogos? • 2 tipos relevantes de subjogos: • subjogos de “cooperação”; • subjogos de “não-cooperação”. • Naqueles subjogos de não-cooperação, a estratégia prevê um equilíbrio de Nash do jogo constituinte.
Subjogos de cooperação • Nos subjogos de cooperação, as estratégias constituem equilíbrio se: 4+4+42+... ≥ 5++2... 4/(1-) ≥ 5+/(1-) ≥ 1/4.
Implementando o que é possível • O que acontece se <1/4 ? • Considere uma versão modificada do dilema dos prisioneiros, em que:
Continuação • Estratégia do gatilho: • Joga NC no 1o período; • Joga NC se observou (NC,NC) em todos os períodos anteriores e C caso contrário. • Nos subjogos de cooperação, as estratégias constituem equilíbrio se: M+M+M2+... ≥ 5++2... M/(1-) ≥ 5+/(1-) M ≥ 5-4.
Lições • Como os jogadores descontam muito o futuro, torna-se necessária uma compensação maior para que a cooperação ocorra. • No jogo analisado, existem apenas duas estratégias. Não há possibilidade de implementar uma cooperação que envolva menos incentivos ao desvio.
Implementando cooperação com punições mais brandas • A estratégia do gatilho envolve punições muito agressivas que, diante de um desvio, penaliza os jogadores indefinidamente. • Considere o seguinte par de estratégias (“stick and carrot”): • Joga NC no 1o período; • Joga NC se observou (NC,NC) ou (C,C) no período anterior; • Joga C caso contrário.
Estratégia • Diante de um desvio em k+1, a punição tem duração de apenas 1 período.
Equilíbrio de Nash Perfeito em Subjogos • Nos subjogos de punição, a análise é a mesma da estratégia do gatilho. • Nos subjogos de cooperação, as estratégias constituem equilíbrio se: 4+4+42+... ≥ 5++42... 4+4 ≥ 5+ ≥ 1/3.
Lição • Punições mais brandas requerem uma taxa de desconto mínima maior para a implementação da cooperação.
(0,5) (4,4) (5,0) (1,1) Definições • Ganho médio: 1, 2, 3,... (1-) t t-1t. • Ganhos factíveis:
Teorema Folk • Friedman, 1971 Seja G um jogo estratégico com informação completa e (e1,...,eN) os ganhos de um equilíbrio de Nash de G. Seja (x1,...,xN) um vetor de ganhos factíveis de G. Se xi > ei para todo i e for suficientemente próximo de 1, existe um ENPS do jogo repetido com horizonte infinito que atinge (x1,...,xN) como ganho médio.
(0,5) (4,4) (5,0) (1,1) Teorema Folk Ganhos atingíveis em ENPS