1 / 75

Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez

Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez sophie.loriette@utt.fr bureau H213 Laboratoire LM2S Université de technologie de Troyes 12, rue Marie Curie BP 2060 10010 TROYES cedex. Plan du cours. Quand utiliser le ràpc ? Origines du ràpc :

ronli
Download Presentation

Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Raisonnement à partir de cas : des fondements aux applications Sophie Loriette-Rougegrez sophie.loriette@utt.fr bureau H213 Laboratoire LM2S Université de technologie de Troyes 12, rue Marie Curie BP 2060 10010 TROYES cedex

  2. Plan du cours • Quand utiliser le ràpc ? • Origines du ràpc : • Le modèle cognitif • Le raisonnement par analogie • Les étapes du ràpc • Les techniques utilisées • Le ràpc et les autres techniques de raisonnement • Adresses et bibliographie

  3. Pourquoi le RàPC ? • Problème dans la construction de certains systèmes à base de connaissances : la connaissance s’adapte mal à une représentation déclarative sous forme de règles Experience REGLES

  4. Exemples d’utilisation du RàPC • Diagnostic médical : “Les problèmes de ce patient sont très semblables aux symptômes de cette maladie” • immobilier : Ma maison est très semblable à celle qui vient d ’être vendue au bas de la rue pour 750 000 F • domaine juridique : Ce licenciement abusif est en tout point similaire au dossier Dulino de mai 97

  5. Quand utiliser le Ràpc ? lorsque .... • L ’expérience représente la plus grande partie des connaissances sur un sujet • Les experts parlent de leur domaine en citant des exemples • Les problèmes ne sont pas complètement compris (modèles faibles, connaissances du domaine faibles) • Beaucoup d ’exceptions au cas général • Besoin de construire une mémoire d’entreprise • Un volume de données satisfaisant doit exister suffisantes

  6. Principe sous-jacent au RàPC Nouveau problème Problème Nouvelle solution Solution Nouveau problème = problème cible ancien problème = problème source Nouvelle solution = solution cible ancienne solution = solution source

  7. Problème/Solution • Pas de définition générale • Définition liée à chaque application • Selon la tâche, • la solution sera bien ou approximativement définie (classification/aide à la décision) • la qualité de la solution pourra être évaluée

  8. Modèle cognitif du rapc • Influence majeure : recherches sur les processus liés à la compréhension • La compréhension est vue comme un processus d ’explication • notre connaissance permet de générer les explications • Exemple : Cela suppose un certain nombre de prédictions pour lier les éléments du texte les uns aux autres. Frédéric est allé au restaurant. Il a commandé un menu végétarien.

  9. Théorie des scripts • Schank et Abelson (77) proposent une représentation de notre connaissance sous forme de scripts • Les scripts représentent notre connaissance épisodique • D ’autres formes de connaissance existent (buts, plans, etc.) déjà considérés dans les systèmes informatiques • Les scripts sont supposés faciliter notre compréhension par expositions répétées à la même situation • Scripts = alternative à la théorie des schémas (Brewer & Nakamura 84)

  10. Insuffisances du modèle • Un script est supposé servir de référence dans la compréhension d ’un épisode. • Ex : script « aller chez le dentiste » • On doit pouvoir représenter des schémas généraux et des instances de ces schémas • La théorie des scripts ne précise rien sur ce qui est créé en premier Un schéma général créé à partir de plusieurs instances ? Une première instance généralisée pour servir de schéma général ?

  11. Insuffisances du modèle (suite) Les scripts sont très détaillés Des scènes se répètent Redondance d ’informations, sans lien entre ses différentes instances - Coûteux - frein à la généralisation

  12. Insuffisances du modèle (suite) Expériences de Bower, Black, Turner (1979) Les résultats mettent en évidence des confusions entre scènes appartenant à des scripts différents

  13. L ’accès aux connaissances épisodiques • Comment accède-t-on aux connaissances épisodiques ? • Travaux de Schank et Abelson en 77 émettent l ’hypothèse suivant laquelle les mêmes algorithmes sont utilisés à la fois pour la recherche de la connaissance générale et de la connaissance spécifique Théorie de la mémoire dynamique (Schank 82)

  14. Théorie de la mémoire dynamique (Schank 82) • Hypothèses • se souvenir, comprendre, expérimenter, apprendre, sont des processus indissociables • la mémoire évolue sous l ’influence de l ’expérience Proposition de M.O.P.

  15. MOP : consulter un professionnel Séq. évts Scènes Serv. = phys. Exam.. Serv = toothage Scripts $toothage $exam

  16. La scène « commande »

  17. Autre origine : le raisonnement par analogie "rapport, similitude partielle d'une chose avec une autre" • ex : analogie atome/système solaire, l'analogie courant électrique/cours d'eau. • Le raisonnement par analogie consiste à avoir recours à un élément mieux connu pour inférer des informations sur un élément qui l'est moins. • Deux types d’analogie : analogie heuristique [Coulon et al. 89-90] et analogie recours [Bruneau et al. 89]

  18. Composantes • Théorie de Spearman : 3 composantes • Théorie  componentielle de Sternberg (1977) : opérations mentales fondamentales • Ordre contesté en 79 par Whitely et Barnes : approximations successives • Gentner (83 ) : importance de l ’identification de relations de haut niveau

  19. Le "carré" analogique  a C A  b      c D B

  20. Prix ? Adaptation Cas similaires Principales étapes du RàPC • Une situation cible • Recherche de cas similaires dans la base de cas (<> BD) • Adaptation de la solution trouvée • Représentation des cas • indexation des cas • évaluation et comparaison de cas • adaptation de cas

  21. Généralités • Cas • une expérience • Base de cas • les cas doivent être bien choisis : typiques, importants, etc. • Similarité • évaluer la ressemblance de 2 cas (ou la pertinence d ’un cas ?)

  22. Généralités (suite) • Similarité : • locale (valeurs d ’attributs) • globale (ts attributs + poids). • Recherche de cas • BD : appariement exact • CBR : appariement inexact • L ’appariement doit être efficace

  23. Généralités (suite) • Adaptation • de petites différences peuvent engendrer des modifications importantes • Apprentissage • Objectif : améliorer les performances du système au fur et à mesure de son fonctionnement CBR peut être combiné à d ’autres modes de raisonnement

  24. La représentation des cas

  25. Qu'est-ce qu'un cas ? "Une connaissance contextualisée qui représente une expérience enseignant une leçon pour satisfaire les buts du raisonneur" (Kolodner 93) • Circonstances ou situation relatifs à une personne, une chose, une action... • Une chose qui a existé ou qui s'est réellement produite • Des circonstances décrivant un contexte dans lequel a été prise une décision Une description de surface

  26. Représentation des cas • Les cas sont souvent décrits par un ensemble de caractéristiques Année Modèle Constructeur Options Kilométrage

  27. Contenu des cas • Représentation minimale description de problème solution • Extensions Contexte (justification etc.) Liens avec d’autres cas Echecs rencontrés

  28. Formalismes de représentation • Frames (MEDIATOR (Kolodner and Simpson 89)), (Casey (Koton 89)) • Objets : frames + héritage de procédures + envois de messages. KRL (Bobrow et Winograd 77) • Logique des propositions/prédicats • Vecteurs

  29. CHEF (Hammond 89)

  30. Les cas de CELIA (Redmond 92) Titre du cas - la voiture cale 1 3 11 2 4 5 6, 9 7 8 10

  31. CELIA • Cas structurés en fragments • 1 fragment -> 1 but de l ’enseignant • fragments indexés individuellement • contexte  fragment • contexte = dysfonctionnements du système diagnostiqué + résultat des actions entreprises + historique des actions entreprises • similarité sur la liste des actions entreprises et le but • Indexation des fragments par une structure de MOP

  32. Instant tk Instant tl CASE REPRESENTATION in REBECAS (Loriette-Rougegrez 95) Case 3 (axis d) Instant ti Instant tj Propagation Relief Vegetation Wind

  33. PAST FUTURE Relief source parameters Pins Coniferes Vegetation 1000 m 2300 m Wind 50 km/h 110 ° 21/8/90 17:00 40 km/h, 140 ° 21/8/90 16:15 target parameters Propagation 21/8/90 17:00 (125°, 1700m) 21/8/90 16:30 (125°, 1400 m) An axis in REBECAS

  34. L ’indexation

  35. Indexation • Objectif : pouvoir retrouver, rapidement, les bons cas. Les indices indiquent les circonstances dans lesquelles le cas peut être utile  indexation au moment de la constitution de la base de cas • Déterminer en quoi un cas est proche de la nouvelle situation  recherche des cas les plus intéressants

  36. Problématique de l ’indexation • Les succès et les échecs sont-ils indexés dans la même base de cas ? • Les indices organisent-ils la base de cas sur des similarités ou différences (HYPO (Ashley 91)) ? • A quoi accède-t-on ? • Nombre de cas • succès/échecs • instances/généralisations ? • Descriptions de problèmes/solutions ? • L ’indexation est-elle nécessaire : plus proche voisins + implémentation parallèle suffisantes ? • Stocker des échecs ou revoir l ’indexation ? Ou utiliser des démons (CHEF) ?

  37. Qualités requises pour les indices • Permettre de différencier les cas, et être annonciateurs de l ’issue du cas • avoir un bon niveau d ’abstraction • pour pourvoir rendre les cas utilisables dans différentes circonstances • en évitant toutefois un niveau d ’abstraction trop élevé pouvant être à l ’origine d ’inférences multiples pour reconnaître les correspondances entre attributs • couvrir l ’ensemble des cas pouvant se produire : le choix se fait essentiellement en fonction du domaine et des tâches à effectuer par le système

  38. Indexation manuelle • Etablir la check-liste • 1. Lister les tâches faisant l ’objet de la recherche de cas, • 2. Pour chaque tâche, déterminer les types de caractéristiques prédictives des solutions, • 3. Idem pour les caractéristiques prédictives des issues, • 4. Pour chaque type de caractéristique, calculer l ’ensemble des généralisations utiles de la caractéristique et s ’assurer que les caractéristiques choisies sont reconnaissables (disponibles pendant le raisonnement), • 5. Créer la check liste en collectant l ’ensemble complet de caractéristiques • à partir de la comparaison 2 à 2 des cas, déterminer ce qui permet de les différencier (ici on parle des valeurs et non des indices) (CYRUS) => souvent combinaison des 2. Aboutit généralement à un grand nombre d ’indices prédictifs, mais trop nombreux pour être prédictifs dans tous les cas.=> recherche du meilleur cas en 2 étapes ex : MEDIATOR (buts des disputants, types d ’objets disputés), CLAVIER (Hennessy et hinkle 92 )

  39. Méthodes d'indexationautomatiques • Méthodes statistiques • permettent de déterminer les caractéristiques importantes, et de leur associer un poids • utilisation a priori • génération d ’explications : pour savoir comment indexer un cas, on explique l ’issue du cas. Les indices sont les éléments apparaissant dans l ’explication. • méthode inductive • Combinaison de plusieurs méthodes : manuelle + explications dans CHEF

  40. Indexation automatique par explication (knowledge-based) • création d ’explications par un système peut se faire par différentes méthodes : • mécanisme de preuve, • case-based (swale (kass et leake 88)) : stocke explications, • règles (chef) • expliquer quoi ? buts poursuivis lors de la réalisation de la situation décrite dans le cas • utilise beaucoup de connaissances du domaine • procède à une généralisation de l ’explication • puis extrait les indices de l ’explication généralisée • Avantage : les indices sont toujours liés à la réussite ou l ’échec décrit dans le cas

  41. Indexation par induction • Intéressant lorsque le but guidant la recherche de cas est très bien défini. • Les cas sont considérés comme des exemples illustrant des concepts • Des algorithmes comme ID3 (Quinlan 86) sont alors utilisables • Avantages : • procède à un calcul rigoureux des indices permettant de distinguer et de représenter les cas • ce calcul sert à organiser la base de cas. Temps d ’accès de l ’ordre de log(N) • ne nécessite pas de connaissance du domaine • Inconvénients : • temps de calcul • requiert une grande base de cas au départ pour exécuter l ’algorithme d ’induction • Technique présente dans les outils de construction de systèmes rapc

  42. Modèles qualitatifs • Utilisés entre autres dans (Dattani and Bramer, 1995) • Un modèle qualitatif contient des nœuds représentant des paramètres du domaine d ’application, et des arcs, représentant leurs relations (une flèche dans (Dattani and Bramer, 1995) indique un lien de précédence) • Le modèle indique également en quoi une combinaison de caractéristiques affecte l ’issue du cas -> utilisé au cours de l ’indexation inductive • Editeur de modèles dans REMIND

  43. Utilisation des modèles qualitatifs • Immobilier (Dattani and Bramer 1995) • Maintenance d ’avions (Dattani, Magaldi and Bramer 1996) • Maintenance de réseaux de PC (Moss, Bramer and Dattani 1996)

  44. La recherche du/des meilleur(s) cas

  45. Rechercher quels cas ? • Les cas utiles • un cas est utile s'il est similaire au nouveau problème selon des dimensions aidant le raisonneur à faire une tâche ou atteindre un but (Kolodner 93) • il faut : • un algorithme qui sache comment explorer la mémoire • des algorithmes capables de choisir quels cas sont intéressants • le nouveau problème • On peut aussi rechercher des « fragments » de cas CELIA, REBECAS !

  46. La similarité ne suffit pas toujours • des informations peuvent avoir de l ’importance dans certains cas et pas dans d ’autres. Ex : âge du patient • on doit rechercher les cas utiles. Notion subjective et variable dans le temps • L ’utilité ne peut être calculée a priori mais la similarité peut l ’être. La similarité est une mesure objective

  47. Propriétés souhaitées • La similarité entre le cas cible et le cas source implique une utilité du cas source • la similarité est basée sur des faits connus • la similarité peut être plus ou moins grande : nécessité de la quantifier

  48. Fonctions d’acceptation • Origine : [Lenz et al. 98] • cas cible noté q, cas considéré noté c • On définit l ’acceptation entre c et q, notée acc(q, c) • acc(q, c) est fonction des acceptations locales entre entités d ’informations (attributs-valeurs) • (e,e ’), acceptation locale entre e et e ’, peut être forte pour 2 entités liées : e et e ’ similaires/e et e ’ contraires • (e,e ’)=0 si e ’ est sans intérêt pour e • (e,e ’)<0 si e ’ doit absolument être évité

  49. été 0 mois Fonctions d ’acceptation (suite) • (e,e ’)peut être définie par une fonction floue représentant le domaine de l ’attribut ex : (été,mois = juin) • Plusieurs entités e ’ peuvent être associées à une entité e: nécessité d ’une fonction locale d ’accumulation 1

  50. Fonctions d ’acceptation (suite) • Acceptation globale • doit considérer l ’intérêt de chaque attribut dans c, pour q • fonction de la pertinence de chaque ei dans c, des accumulations locales

More Related