1 / 26

Incertitude, risque et apprentissage

Incertitude, risque et apprentissage. ECO8071 – Charles Séguin Inspiré en partie de notes de Larry Karp et Christian Traeger. L’INCERTITUDE, qu’est-ce?. Ne pas connaître la valeur d’un élément? Ne pas connaître la probabilité d’un événement?

lorie
Download Presentation

Incertitude, risque et apprentissage

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Incertitude, risque et apprentissage ECO8071 – Charles Séguin Inspiré en partie de notes de Larry Karp et Christian Traeger

  2. L’INCERTITUDE, qu’est-ce? • Ne pas connaître la valeur d’un élément? • Ne pas connaître la probabilité d’un événement? • Ne pas avoir conscience de la possibilité d’un événement? • Un exemple : lancer une pièce de monnaie en l’air • Qu’est-ce qui est incertain? • Est-ce risqué?

  3. CATÉGORISATION de l’incertain • Incertitude : • Je connais toutes les possibilités; • Je représente la vraisemblance de leur occurrence par des probabilités.

  4. CATÉGORISATION de l’incertain • Incertitude • Ambiguïté et flou : • Je connais toutes les possibilités; • Je ne peux représenter la vraisemblance de leur occurrence par des probabilités uniques. ? ?

  5. CATÉGORISATION de l’incertain • Incertitude • Ambiguïté et flou • Inconscience : • Je ne connais pas toutes les possibilités. • Nous allons nous concentrer sur l’incertitude. ?

  6. INCERTITUDE et RISQUE • Lancer une pièce est-il risqué? • Parier sur le résultat du lancé d’une pièce est-il risqué? • Il y a risque lorsque l’objectif (utilité, profit, etc.) d’un agent est incertain. • L’incertitude d’un élément affectant l’utilité d’un agent expose cet agent au risque.

  7. REPRÉSENTATION de l’incertitude • Variable aléatoire : • Une variable dont les valeurs possibles sont associées à des probabilités. • Probabilité : • Nombre entre 0 et 1 qui mesure la vraisemblance; • La somme des probabilités des valeurs d’une variable aléatoire est 1. • Pile ou face : • Parier 100 $ sur pile :

  8. DISTINCTIONS importantes ou non Incertitude Probabilité Objective : Tirée de données statistiques ou d’un raisonnement logique. Subjective : Représente les croyances de l’agent; Il peut y avoir des probabilités subjectives différentes pour le même événement. • Fondamentale : • La variable est aléatoire indépendamment de la perception de l’agent; • (Purement) stochastique. • Perceptive : • Certaines limitations de l’agent rendent la variable aléatoire; • Incertitude (propre).

  9. ESPÉRANCE et UTILITÉ ESPÉRÉE • Espérance : • Somme des valeurs d’une variable aléatoire pondérée par leurs probabilités; • Pari : • Utilité espérée : • Somme de l’utilité des valeurs d’une variable aléatoire pondérée par leurs probabilité • Pari :

  10. APPRENTISSAGE • Concept dynamique; • Consiste à mettre à jour les probabilités d’une variable aléatoire avec des informations nouvelles; • Après que la pièce soit retombée : • Quels sont les probabilités? • Vas-tu parier 100 $ sur pile? • L’apprentissage peut influencer une décision risquée.

  11. TYPES d’Apprentissage • Surprise (Naïf) : • L’apprentissage n’est pris en compte qu’une fois qu’il s’est produit. • Anticipé (Sophistiqué) : • L’apprentissage est pris en compte avant qu’il se produise. • Passif : • L’apprentissage est exogène aux décisions de l’agent. • Actif : • L’apprentissage est affecté par les décision de l’agent.

  12. Un exemple simple (décision binaire) • 2 périodes; • Décision : construire un barrage ou pas (irréversible); • Bénéfices : un barrage génère des bénéfices de 10M $ par période; • Coûts : un barrage dénature la rivière sur laquelle il est construit, ce qui génère des coûts incertains de 3M $ ou 35M $ avec probabilités égales (peu importe le moment de construction); • L’objectif du décideur est de maximiser l’espérance des bénéfices nets des coûts.

  13. Exemple simpleSANS APPRENTISSAGE • Doit-on construire et quand? Période 1 Période 2 Bénéfices nets espérées Déjà fait oui Construire oui non Construire non

  14. Exemple simpleAVEC APPRENTISSAGE ANTICIPÉ • Si j’anticipe que je vais connaître la valeur des coûts avec certitude à la période 2? Période 1 Période 2 Bénéfices nets Espérance Déjà fait 35 App. oui Déjà fait 3 Construire oui Cons. 35 non non App. oui 3 Cons. non

  15. Exemple simple apprentissage NON-anticipé • Que se passe-t-il à la période 1 si le décideur n’anticipe pas qu’il apprendra la vraie valeur des dommages à la rivière? • Décision identique à l’absence d’apprentissage. • Est-ce toujours le cas? • Non…

  16. Valeur d’OPTION (quasi) • Dans l’exemple précédent, l’apprentissage augmente la valeur maximale de l’objectif (ex ante); • La différence entre la valeur de l’objectif ex ante avec apprentissage anticipé et sans apprentissage anticipé est la valeur d’option; • Dans le cas de notre exemple, la valeur d’option d’attendre d’apprendre avant de décider de construite ou non le barrage est de 2,5M $. • La valeur d’option peut-elle être négative?

  17. Deuxième exemple (décision CONTINUE) • Un problème de changements climatiques : • Deux périodes : • Niveau d’émission dans la période i : • Incertitude sur les dommages : • Objectif : • Quel est le niveau optimal d’émission sans apprentissage? • Réponse : • Objectif maximisé : 2,5

  18. Deuxième exempleAPPRENTISSAGE NON-ANTICIPÉ • Décision sans apprentissage à la période 1 et décision contingente à la période 2. Objectif espéré Objectif ex post Période 1 Période 2

  19. Deuxième exempleAPPRENTISSAGE ANTICIPÉ • Décision contingente à la période 2 utilisée pour résoudre les émissions de la période 1. Objectif espéré Période 1 Période 2

  20. Prudence • L’anticipation de l’apprentissage ne diminue pas nécessairement les actions irréversibles optimales précédents l’apprentissage; • Cela dépend de la nature du problème, du type d’apprentissage et de la prudence du décideur; • La prudence caractérise les préférences du décideur par rapport à un changement de niveau de risque; • Si le risque augmente dans une période, un décideur préférera transférer de la richesse vers cette période si il est prudent; • Un décideur est prudent si la troisième dérivé de sa fonction d’utilité (objectif) est positive.

  21. Principe de précaution • Qu’est-ce? • Définition de la Convention-Cadre des Nations Unies sur les Changements Climatiques : • Lorsqu’il y a risque de dommages irréversibles ou importants, le manque de certitude scientifique complète ne devrait pas justifier de repousser des mesures efficientes pour prévenir la dégradation de l’environnement. • Que pensez-vous de cette définition? • Peut-elle aider à faire des choix?

  22. Résolution PARTIELLE de l’incertitude • Les exemples précédents ont considérés uniquement une résolution complète de l’incertitude. • Qu’est-ce qu’une résolution partielle? • Prenez le dernier exemple. Si au lieu d’apprendre la valeur de S, le décideur modifiait les probabilités attribués à chacune des réalisations de S. • Avec probabilités égales, le décideur peut apprendre que : • a : • b :

  23. Apprentissage ACTIF • L’apprentissage est actif lorsque le décideur peut influencer l’arrivée d’information. • Cela implique souvent un arbitrage entre quête d’information et coûts. • Revenons à notre exemple de changements climatiques (résolution complète de l’incertitude): • Supposons que la résolution complète de l’incertitude est incertaine et que cette incertitude dépend des émissions de la première période; • Avec probabilité j’apprends avec certitude la valeur de S, sinon je n’apprends rien, et .

  24. Incertitude avec INFÉRENCE BAYÉSIENNE • Théorème de Bayes : • En mots : sachant les probabilités inconditionnelles des événements A et B, ainsi que la probabilité conditionnelle de B si A a déjà été observé, quelle est la probabilité de A conditionnelle à l’observation de B? • En math : • Pour l’apprentissage : • Le décideur a ex ante une distribution a priori de la variable aléatoire; • L’observation d’un signal fournira de l’information sur cette variable et permettra d’établir une distribution a posteriori; • Dans les deux premiers exemples avec distributions discrètes, le signal donnait une information parfaite sur la variable aléatoire, ce qui impliquait une distribution a posteriori où une seule valeur avait une probabilité de 1.

  25. Distributions conjuguées • Un truc de modélisation pour utiliser l’inférence bayésienne, les distributions conjuguées. • Si la probabilité postérieure appartient à la même famille que l’antérieure, cette dernière est la conjuguée de la distribution conditionnelle du signal. • Si est la conjuguée antérieure de , alors la distribution appartient à la même famille que . • Exemple : si le signal est distribué conditionnellement Poisson et que A est distribué Gamma, alors A conditionnel au signal est aussi distribué Gamma (signal dist. selon binomiale négative).

  26. Distributions conjuguées EXEMPLE • Revenons encore à l’exemple de changement climatique. • S peut prendre les valeurs entières ; • Quel est le signal? • Sur quoi apprend-t-on? • Qu’est qui est fondamentalement incertain?

More Related