850 likes | 2.03k Views
La théorie des jeux. La théorie des jeux. Analyse des comportements stratégiques Utilisée en économie Relations internationales Jeux d’argent ou de société, etc. Concurrence imparfaite Interactions stratégiques Entreprises tiennent compte de la demande
E N D
La théorie des jeux • Analyse des comportements stratégiques • Utilisée en économie • Relations internationales • Jeux d’argent ou de société, etc. • Concurrence imparfaite • Interactions stratégiques • Entreprises tiennent compte de la demande • Production : fonction des autres entreprises
La théorie des jeux Le dilemme du prisonnier Résolution d’un jeu L’équilibre de Nash L’équilibre en stratégie mixte Les jeux répétés
Le dilemme du prisonnier Le dilemme du prisonnier définit une solution de jeux dans lesquels l’équilibre est sous-optimal La solution optimale ne peut constituer l’équilibre du jeu issu de la rationalité des agents compte tenu des hypothèses de comportement et d’information. Le dilemme du prisonnier démontre la difficulté à établir une coopération entre les agents alors que celles-ci auraient accru le bénéfice des agents.
Le dilemme du prisonnier • Le jeu dans sa forme classique • Deux suspects son arrêtés par la police, mais la police manque de preuve pour les emprisonner. • Il ne peuvent les condamner qu’à un an de prison pour des faits mineurs. • La police doit les faire avouer. • Comment s’y prendre ?
Le dilemme du prisonnier • Les policiers proposent un marché • Si les deux avouent, ils auront chacun 5 ans, si l’un avoue et l’autre nie, ils encourent 1 ou 10 ans, si les deux nient, chacun aura 2 ans de prison
Le dilemme du prisonnier • La solution du jeu est que le deux avouent • Chaque joueur poursuit son propre intérêt • S’agit-il d’un optimum social ? • Contestation de la théorie économique • « A beautiful mind » • Sans coopération, l’équilibre n’est pas optimal
Illustration: duopole avec bien homogène • Deux entreprises sur un marché peuvent : • Se faire concurrence (Cournot) • S’entendre pour partager la rente (cartel) • Profit de l’entente > profit de duopole. • Si l’entente n’est pas illégale, alors cette solution est optimale du point de vue des entreprises. Mais l’entreprise peut essayer de tricher et produire plus.
Illustration: duopole avec bien homogène • 2 joueurs : • 2 entreprises A et B • Produisant le même bien • 2 stratégies : • Produire la quantité de duopole • Produire la quantité d’entente • Etant donnés 2 joueurs et 2 stratégies, le marché peut se trouver dans 4 cas de figure différents.
Illustration: duopole avec bien homogène • Dans un cas d’entente respectée: • Chaque entreprise gagne un profit d’entente • Πe = 10 • Dans un cas de concurrence de duopole : • Chaque entreprise gagne un profit de duopole moins élevé • Πd = 2 • En cas d’entente non respectée: • L’entreprise produisant la quantité de duopole capture des parts de marchés et gagne un profit de tricheur élevé, Πt = 15. L’autre entreprise est pénalisée et gagne un profit minimum, Πm = 0.
Illustration: duopole avec bien homogène Quel est la meilleure stratégie pour chaque entreprise? Pour ent. A: Qd si ent B choisit Qd Qd si ent B choisit Qe Pour ent. B: Qd si ent A choisit Qd Qd si ent A choisit Qe
Illustration: duopole avec bien homogène Remarquons que la stratégie dominante est de produire la quantité de duopole, quelle que soit la stratégie de l’autre joueur. Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs.
La théorie des jeux Le dilemme du prisonnier Résolution d’un jeu L’équilibre de Nash L’équilibre en stratégie mixte Les jeux répétés
Résolution d’un jeu • Un jeu se résout comme suit • Identifier les décisions de A • Meilleure décision de A, compte tenu de B1 • Meilleure décision de A, compte tenu de B2, etc. • Identifier les décisions de B • Meilleure décision de B, compte tenu de A1 • Meilleure décision de B, compte tenu de A2, etc. • On caractérise la solution du jeu, si elle existe
Résolution d’un jeu (1) • Seules les décisions de A sont prises en compte • Seules les décisions de A sont retenues si B choisit Qd • On retient la décision qui génère le plus gros gain *
Résolution d’un jeu (2) • Seules les décisions de A sont prises en compte • Seules les décisions de A sont retenues si B choisit Qe • On retient la décision qui génère le plus gros gain * *
Résolution d’un jeu (3) • Seules les décisions de B sont prises en compte • Seules les décisions de B sont retenues si A choisit Qd • On retient la décision qui génère le plus gros gain * * *
Résolution d’un jeu (4) • Seules les décisions de B sont prises en compte • Seules les décisions de B sont retenues si A choisit Qe • On retient la décision qui génère le plus gros gain * * * *
Résolution d’un jeu (5) • Un jeu a un équilibre quand il génère une convergence des décisions stratégiques • Le couple de stratégies (Qd;Qd) est la solution du jeu * * * *
Résolution d’un jeu - Exemple de l’aéronautique • Prenons le cas de de l’aéronautique, avec deux constructeurs : Airbus et Boeing. • Voici la matrice des profits de chacun des constructeurs quand ils entreprennent de produire (P) ou pas (NP)
Résolution d’un jeu - Exemple (1) • Seules les décisions de Boeing sont prises en compte • Seules les décisions de Boeing sont retenues si Airbus choisit de produire • On retient la décision qui génère le plus gros gain *
Résolution d’un jeu - Exemple (2) • Seules les décisions de Boeing sont prises en compte • Seules les décisions de Boeing sont retenues si Airbus chosit de ne pas produire • On retient la décision qui génère le plus gros gain * *
Résolution d’un jeu - Exemple (3) • Seules les décisions de Airbus sont prises en compte • Seules les décisions de Airbus sont retenues si Boeing choisit de produire • On retient la décision qui génère le plus gros gain * * *
Résolution d’un jeu - Exemple (4) • Seules les décisions de Airbus sont prises en compte • Seules les décisions de Airbus sont retenues si Boeing choisit de ne pas produire • On retient la décision qui génère le plus gros gain * * * *
Résolution d’un jeu - Exemple (5) • Ce jeu a deux équilibres (convergence des décisions stratégiques) • Le couple de stratégies (P;NP) est le premier équilibre du jeu • Le couple de stratégies (NP;P) est le deuxième équilibre du jeu. * * * *
Exemple de jeu sans équilibre * * * *
La théorie des jeux Le dilemme du prisonnier Résolution d’un jeu L’équilibre de Nash L’équilibre en stratégie mixte Les jeux répétés
L’Equilibre de Nash L’équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation en changeant unilatéralement de stratégie, compte tenu des décisions de l’autre joueur Propriétés centrales: • Contribution de John Nash (1950) • L’équilibre de Nash est généralement stable • Chaque jeu défini à au moins un équilibre de Nash: • soit en stratégies pures : les joueurs ne jouent qu'une seule stratégie à l’équilibre • soit en stratégies mixtes : les joueurs jouent plusieurs stratégies avec une probabilité fixe
L’Equilibre de Nash Retour à l’exemple de Duopole: Un joueur peut-il seul améliorer sa position ? L’entreprise A ? L’entreprise B ? Puisque qu’ où aucun joueur ne peut améliorer sa situation, il s’agit d’un équilibre de Nash
Efficacité de l’équilibre Retour à l’exemple de Duopole: La stratégie dominante est de produire« Qd » Mais l’équilibre «Qd-Qd» n’est pas collectivement optimal au sens de Pareto Si le nombre d’agents est restreint, la rationalité individuelle n’amène pas forcement au bien être collectif
Efficacité de l’équilibre Retour à l’exemple de Duopole: Remarquons que puisque les gains en cas d’entente sont supérieurs au gains sans entente, il s’agit d’un jeu de coordination. Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies.
La théorie des jeux Le dilemme du prisonnier Résolution d’un jeu L’équilibre de Nash L’équilibre en stratégie mixte Les jeux répétés
Stratégies pures, stratégies mixtes • Exemple du jeu des tirs au but • 2 joueurs : Gardien et buteur • 2 stratégies : tirer/plonger à gauche/droite • Hypothèse de « talent » des joueurs • Le buteur ne tire jamais à coté • Le gardien intercepte toujours si du bon coté • Ceci permet de simplifier !! • Quelle est la matrice des gains ?
Stratégies pures, stratégies mixtes Pour le buteur: D si le gardien choisit G G si le gardien choisit D Pour le gardien: G si le buteur choisit G D si le buteur choisit D Quel que soit le résultat, l’un des joueurs peut améliorer sa situation en changeant de stratégie. Pas d’équilibre de Nash en stratégies pures !
Stratégies pures, stratégies mixtes Il existe cependant un équilibre enstratégies mixtes • Stratégie pour les 2 joueurs: • Jouer G et D 50% du temps (1 fois sur deux) • Chaque cas à une probabilité de 0.25 • Le buteur marque un but sur deux, l’autre est arrêté par le gardien
Stratégies pures, stratégies mixtes Vérifions que cet équilibre est bien un équilibre de Nash: • Le gardien joue G et D 50% du temps. Le buteur peut il augmenter son taux de succès en déviant de la règle 50-50? • Si le buteur décide de jouer 60% à gauche et 40% à droite, son taux de succès est: (0.6 ✕ 0.5) + (0.4 ✕ 0.5) = 0.5 (0.3) + (0.2) = 0.5 • En choisissant 60-40, le buteur marque plus à gauche mais moins à droite. Son taux de succès est le même, il ne peut donc pas améliorer sa situation. On a bien un équilibre de Nash
La théorie des jeux Le dilemme du prisonnier Résolution d’un jeu L’équilibre de Nash L’équilibre en stratégie mixte Les jeux répétés
Les jeux répétés • La nature et la stabilité de l’équilibre dépendent du fait que le jeu est répété ou non. • L’existence d’équilibre en stratégies mixtes, par exemple, repose sur une répétition du jeu. • Même dans les cas de stratégie pure (par exemple le dilemme du prisonnier), la stabilité est affectée par les répétitions du jeu. • Dépend de l’horizon temporel du jeu • Jeu fini • Jeu infini
Les jeux répétés • Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à l’infini • On peut sanctionner le « tricheur » lors du jeu suivant. • On peut aussi mettre en place une menace crédible pour dissuader le tricheur. • Stratégie du donnant-donnant (Tit-for-tat) : comportement mimétique (Axelrod)
Les jeux répétés • Cas du duopole: l’équilibre socialement préférable (entente) peut être stable dans le temps si le jeu est répété à horizon fini • Le jeu s’arrête au bout the T périodes • Raisonnement à rebours (backward induction) • On part de la dernière période • On détermine ce que l’on doit faire en T-1 en fonction de T, etc. • Pas de solution stable
Théorie des jeux : définitions • Une stratégie dominante est une stratégie qui ne dépend pas des décisions des autres joueurs • L’équilibre d’un jeu est un couple de décision convergente (pas nécessairement les mêmes) • Un équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation unilatéralement • Une stratégie mixte est une stratégie qui fait appel à des choix aléatoires ou probabilistes • Un jeu de coordination est un jeu où les paiements sont plus élevés quand les joueurs peuvent coordonner leurs stratégies. • Un jeu à somme nulle est un jeu où les gains de l’un des joueurs représentent les pertes de l’autre.