1.26k likes | 1.42k Views
SOGEA Vendredi 16 février 2007. Approximation des Equilibres et recherches sur petits supports. Sébastien Hémon LRI-Université paris Sud Orsay. Plan de l’exposé. Introduction : Jeux, équilibres Approximations et exemples Résultats connus Construction de cas pathologiques non rares
E N D
SOGEA Vendredi 16 février 2007 Approximation des Equilibres et recherches sur petits supports Sébastien Hémon LRI-Université paris Sud Orsay
Plan de l’exposé • Introduction : Jeux, équilibres • Approximations et exemples • Résultats connus • Construction de cas pathologiques non rares • Etat des recherches et ouvertures
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale :
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale : • Deux joueurs A et B qui jouent sur des ensembles de stratégies Set T.
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale : • Deux joueurs A et B qui jouent sur des ensembles de stratégies Set T. • Des fonctions d’utilité et ℝ ℝ
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale : • Deux joueurs A et B qui jouent sur des ensembles de stratégies Set T. • Des fonctions d’utilité • Des distributions de probabilités λ et μ sur les stratégies de A et B resp. et ℝ ℝ
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale : • Deux joueurs A et B qui jouent sur des ensembles de stratégies Set T. • Des fonctions d’utilité • Des distributions de probabilités λ et μ sur les stratégies de A et B resp. • Les profils stratégiques (couple de distributions sur les stratégies). et ℝ ℝ
Les jeux sous forme normale Nous nous restreignons ici au cas de jeux à deux joueurs. Nous rappelons les données d’un jeu sous forme normale : • Deux joueurs A et B qui jouent sur des ensembles de stratégies Set T. • Des fonctions d’utilité • Des distributions de probabilités λ et μ sur les stratégies de A et B resp. • Les profils stratégiques (couple de distributions sur les stratégies). et ℝ ℝ Matériel supplémentaire :Deux matrices A et B pour représenter les utilités Enumération des stratégies :S = {σ1, σ2, … , σn } et T = {τ1, τ2, … , τm } Supports :S S et T T de taille d. Gain moyen :tλAμ pour A et tλBμ pour B
L’équilibre de Nash L’équilibre intervient lorsqu’aucun joueur n’a intérêt à changer de stratégie. On dit que (λ;μ ) est un équilibre de Nash lorsque :
L’équilibre de Nash L’équilibre intervient lorsqu’aucun joueur n’a intérêt à changer de stratégie. On dit que (λ;μ ) est un équilibre de Nash lorsque : • Chaque joueur maximise son gain contre la stratégie adverse :
L’équilibre de Nash L’équilibre intervient lorsqu’aucun joueur n’a intérêt à changer de stratégie. On dit que (λ;μ ) est un équilibre de Nash lorsque : • Chaque joueur maximise son gain contre la stratégie adverse : • Aucun joueur n’a intérêt seul à dévier de sa stratégie :
L’équilibre de Nash L’équilibre intervient lorsqu’aucun joueur n’a intérêt à changer de stratégie. On dit que (λ;μ ) est un équilibre de Nash lorsque : • Chaque joueur maximise son gain contre la stratégie adverse : • Aucun joueur n’a intérêt seul à dévier de sa stratégie :
L’équilibre de Nash L’équilibre intervient lorsqu’aucun joueur n’a intérêt à changer de stratégie. On dit que (λ;μ ) est un équilibre de Nash lorsque : • Chaque joueur maximise son gain contre la stratégie adverse : • Aucun joueur n’a intérêt seul à dévier de sa stratégie : • Chaque stratégie pure impliquée est meilleure réponse à la stratégie adverse
La classe PPAD Les problèmes PPAD :
La classe PPAD Les problèmes PPAD : • Une classe de problèmes totaux
La classe PPAD Les problèmes PPAD : • Une classe de problèmes totaux • Argument d’existence de solution : Si un graphe orienté a un sommet dont la différence entre degré entrant et sortant est non nulle, il doit en exister un autre.
La classe PPAD Les problèmes PPAD : • Une classe de problèmes totaux • Argument d’existence de solution : Si un graphe orienté a un sommet dont la différence entre degré entrant et sortant est non nulle, il doit en exister un autre. • PPAD-complet : les plus durs d’entre eux.
La classe PPAD Les problèmes PPAD : • Une classe de problèmes totaux • Argument d’existence de solution : Si un graphe orienté a un sommet dont la différence entre degré entrant et sortant est non nulle, il doit en exister un autre. • PPAD-complet : les plus durs d’entre eux. • Exemples : Brower, Sperner, Nash
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet :
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :»
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : »
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative :
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative : • Chen & al. dans [CDT] : « An well-supported Nash Equilibrium is : »
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative : • Chen & al. dans [CDT] : « An well-supported Nash Equilibrium is : »
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative : • Chen & al. dans [CDT] : « An well-supported Nash Equilibrium is : »
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative : • Chen & al. dans [CDT] : « An well-supported Nash Equilibrium is : »
Approximation(s) Le fameux ε –Nash c’est quoi ? Une bonne question en effet : • Lipton & al. dans [LMM] : « It is well-known in the litterature that :» • Feder & al. dans [FNS] : « an ε-approximate Nash is : » • Les algorithmiciens aiment travailler avec l’erreur relative : • Chen & al. dans [CDT] : « An well-supported Nash Equilibrium is : »
Exemple : Pour un Nash additif, procédure Naïve :
Exemple : Pour un Nash additif, procédure Naïve : Stratégies B Stratégies A Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : Stratégies B Stratégies A Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : Stratégies B Maximum Stratégies A Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : Stratégies B Maximum Stratégies A Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : Stratégies B Maximum Stratégies A Maximum Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD]
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Preuve :
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Preuve : Bob gagne au moins Max/2
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Preuve : Bob gagne au moins Max/2 Alice gagne au moins Max/2
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Manque à gagner : Preuve : Bob gagne au moins Max/2 Alice gagne au moins Max/2
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Manque à gagner : ε ≤ Max/2 ≤ 1/2 Preuve : Bob gagne au moins Max/2 Alice gagne au moins Max/2 Jeu normalisé sur [0;1]
Exemple : Pour un Nash additif, procédure Naïve : 1 Stratégies B Maximum 1/2 Stratégies A 1/2 Maximum Utilités Alice Utilités Bob ½-Nash (add), par [PMD] Manque à gagner : ε ≤ Max/2 ≤ 1/2 Preuve : Bob gagne au moins Max/2 D’après [DMP] Alice gagne au moins Max/2 Jeu normalisé sur [0;1]
Résultats connus • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium
Résultats connus • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent.
Résultats connus • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε)
Résultats connus • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε) • Trouver un ε –Nash (sens add )
Résultats connus • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε) • Trouver un ε –Nash (sens add ) • Trouver un bon Nash approché (sens mul) avec petit support
Résultats connus PPAD-Complete • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε) • Trouver un ε –Nash (sens add) • Trouver un bon Nash approché (sens mul) avec petit support
Résultats connus PPAD-Complete • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε) • Trouver un ε –Nash (sens add) • Trouver un bon Nash approché (sens mul) avec petit support Impossible
Résultats connus [CDT] PPAD-Complete • Nash à 2 joueurs pour un ε–well supported Nash Equilibrium • Nash à plus de joueurs aussi par conséquent. • Trouver un schéma d’approximation complet en temps poly(n,1/ε) • Trouver un ε –Nash (sens add) • Trouver un bon Nash approché (sens mul) avec petit support Impossible