260 likes | 371 Views
Incertitude, risque et apprentissage. ECO8071 – Charles Séguin Inspiré en partie de notes de Larry Karp et Christian Traeger. L’INCERTITUDE, qu’est-ce?. Ne pas connaître la valeur d’un élément? Ne pas connaître la probabilité d’un événement?
E N D
Incertitude, risque et apprentissage ECO8071 – Charles Séguin Inspiré en partie de notes de Larry Karp et Christian Traeger
L’INCERTITUDE, qu’est-ce? • Ne pas connaître la valeur d’un élément? • Ne pas connaître la probabilité d’un événement? • Ne pas avoir conscience de la possibilité d’un événement? • Un exemple : lancer une pièce de monnaie en l’air • Qu’est-ce qui est incertain? • Est-ce risqué?
CATÉGORISATION de l’incertain • Incertitude : • Je connais toutes les possibilités; • Je représente la vraisemblance de leur occurrence par des probabilités.
CATÉGORISATION de l’incertain • Incertitude • Ambiguïté et flou : • Je connais toutes les possibilités; • Je ne peux représenter la vraisemblance de leur occurrence par des probabilités uniques. ? ?
CATÉGORISATION de l’incertain • Incertitude • Ambiguïté et flou • Inconscience : • Je ne connais pas toutes les possibilités. • Nous allons nous concentrer sur l’incertitude. ?
INCERTITUDE et RISQUE • Lancer une pièce est-il risqué? • Parier sur le résultat du lancé d’une pièce est-il risqué? • Il y a risque lorsque l’objectif (utilité, profit, etc.) d’un agent est incertain. • L’incertitude d’un élément affectant l’utilité d’un agent expose cet agent au risque.
REPRÉSENTATION de l’incertitude • Variable aléatoire : • Une variable dont les valeurs possibles sont associées à des probabilités. • Probabilité : • Nombre entre 0 et 1 qui mesure la vraisemblance; • La somme des probabilités des valeurs d’une variable aléatoire est 1. • Pile ou face : • Parier 100 $ sur pile :
DISTINCTIONS importantes ou non Incertitude Probabilité Objective : Tirée de données statistiques ou d’un raisonnement logique. Subjective : Représente les croyances de l’agent; Il peut y avoir des probabilités subjectives différentes pour le même événement. • Fondamentale : • La variable est aléatoire indépendamment de la perception de l’agent; • (Purement) stochastique. • Perceptive : • Certaines limitations de l’agent rendent la variable aléatoire; • Incertitude (propre).
ESPÉRANCE et UTILITÉ ESPÉRÉE • Espérance : • Somme des valeurs d’une variable aléatoire pondérée par leurs probabilités; • Pari : • Utilité espérée : • Somme de l’utilité des valeurs d’une variable aléatoire pondérée par leurs probabilité • Pari :
APPRENTISSAGE • Concept dynamique; • Consiste à mettre à jour les probabilités d’une variable aléatoire avec des informations nouvelles; • Après que la pièce soit retombée : • Quels sont les probabilités? • Vas-tu parier 100 $ sur pile? • L’apprentissage peut influencer une décision risquée.
TYPES d’Apprentissage • Surprise (Naïf) : • L’apprentissage n’est pris en compte qu’une fois qu’il s’est produit. • Anticipé (Sophistiqué) : • L’apprentissage est pris en compte avant qu’il se produise. • Passif : • L’apprentissage est exogène aux décisions de l’agent. • Actif : • L’apprentissage est affecté par les décision de l’agent.
Un exemple simple (décision binaire) • 2 périodes; • Décision : construire un barrage ou pas (irréversible); • Bénéfices : un barrage génère des bénéfices de 10M $ par période; • Coûts : un barrage dénature la rivière sur laquelle il est construit, ce qui génère des coûts incertains de 3M $ ou 35M $ avec probabilités égales (peu importe le moment de construction); • L’objectif du décideur est de maximiser l’espérance des bénéfices nets des coûts.
Exemple simpleSANS APPRENTISSAGE • Doit-on construire et quand? Période 1 Période 2 Bénéfices nets espérées Déjà fait oui Construire oui non Construire non
Exemple simpleAVEC APPRENTISSAGE ANTICIPÉ • Si j’anticipe que je vais connaître la valeur des coûts avec certitude à la période 2? Période 1 Période 2 Bénéfices nets Espérance Déjà fait 35 App. oui Déjà fait 3 Construire oui Cons. 35 non non App. oui 3 Cons. non
Exemple simple apprentissage NON-anticipé • Que se passe-t-il à la période 1 si le décideur n’anticipe pas qu’il apprendra la vraie valeur des dommages à la rivière? • Décision identique à l’absence d’apprentissage. • Est-ce toujours le cas? • Non…
Valeur d’OPTION (quasi) • Dans l’exemple précédent, l’apprentissage augmente la valeur maximale de l’objectif (ex ante); • La différence entre la valeur de l’objectif ex ante avec apprentissage anticipé et sans apprentissage anticipé est la valeur d’option; • Dans le cas de notre exemple, la valeur d’option d’attendre d’apprendre avant de décider de construite ou non le barrage est de 2,5M $. • La valeur d’option peut-elle être négative?
Deuxième exemple (décision CONTINUE) • Un problème de changements climatiques : • Deux périodes : • Niveau d’émission dans la période i : • Incertitude sur les dommages : • Objectif : • Quel est le niveau optimal d’émission sans apprentissage? • Réponse : • Objectif maximisé : 2,5
Deuxième exempleAPPRENTISSAGE NON-ANTICIPÉ • Décision sans apprentissage à la période 1 et décision contingente à la période 2. Objectif espéré Objectif ex post Période 1 Période 2
Deuxième exempleAPPRENTISSAGE ANTICIPÉ • Décision contingente à la période 2 utilisée pour résoudre les émissions de la période 1. Objectif espéré Période 1 Période 2
Prudence • L’anticipation de l’apprentissage ne diminue pas nécessairement les actions irréversibles optimales précédents l’apprentissage; • Cela dépend de la nature du problème, du type d’apprentissage et de la prudence du décideur; • La prudence caractérise les préférences du décideur par rapport à un changement de niveau de risque; • Si le risque augmente dans une période, un décideur préférera transférer de la richesse vers cette période si il est prudent; • Un décideur est prudent si la troisième dérivé de sa fonction d’utilité (objectif) est positive.
Principe de précaution • Qu’est-ce? • Définition de la Convention-Cadre des Nations Unies sur les Changements Climatiques : • Lorsqu’il y a risque de dommages irréversibles ou importants, le manque de certitude scientifique complète ne devrait pas justifier de repousser des mesures efficientes pour prévenir la dégradation de l’environnement. • Que pensez-vous de cette définition? • Peut-elle aider à faire des choix?
Résolution PARTIELLE de l’incertitude • Les exemples précédents ont considérés uniquement une résolution complète de l’incertitude. • Qu’est-ce qu’une résolution partielle? • Prenez le dernier exemple. Si au lieu d’apprendre la valeur de S, le décideur modifiait les probabilités attribués à chacune des réalisations de S. • Avec probabilités égales, le décideur peut apprendre que : • a : • b :
Apprentissage ACTIF • L’apprentissage est actif lorsque le décideur peut influencer l’arrivée d’information. • Cela implique souvent un arbitrage entre quête d’information et coûts. • Revenons à notre exemple de changements climatiques (résolution complète de l’incertitude): • Supposons que la résolution complète de l’incertitude est incertaine et que cette incertitude dépend des émissions de la première période; • Avec probabilité j’apprends avec certitude la valeur de S, sinon je n’apprends rien, et .
Incertitude avec INFÉRENCE BAYÉSIENNE • Théorème de Bayes : • En mots : sachant les probabilités inconditionnelles des événements A et B, ainsi que la probabilité conditionnelle de B si A a déjà été observé, quelle est la probabilité de A conditionnelle à l’observation de B? • En math : • Pour l’apprentissage : • Le décideur a ex ante une distribution a priori de la variable aléatoire; • L’observation d’un signal fournira de l’information sur cette variable et permettra d’établir une distribution a posteriori; • Dans les deux premiers exemples avec distributions discrètes, le signal donnait une information parfaite sur la variable aléatoire, ce qui impliquait une distribution a posteriori où une seule valeur avait une probabilité de 1.
Distributions conjuguées • Un truc de modélisation pour utiliser l’inférence bayésienne, les distributions conjuguées. • Si la probabilité postérieure appartient à la même famille que l’antérieure, cette dernière est la conjuguée de la distribution conditionnelle du signal. • Si est la conjuguée antérieure de , alors la distribution appartient à la même famille que . • Exemple : si le signal est distribué conditionnellement Poisson et que A est distribué Gamma, alors A conditionnel au signal est aussi distribué Gamma (signal dist. selon binomiale négative).
Distributions conjuguées EXEMPLE • Revenons encore à l’exemple de changement climatique. • S peut prendre les valeurs entières ; • Quel est le signal? • Sur quoi apprend-t-on? • Qu’est qui est fondamentalement incertain?