630 likes | 754 Views
OntoCASE : méthodologie et assistant logiciel pour une ingénierie ontologique fondée sur la transformation d’un modèle semi-formel. Soutenance de thèse de Michel Héon Direction : Gilbert Paquette et Josianne Basque. 4 novembre 2010. Déroulement de la présentation. Introduction
E N D
OntoCASE:méthodologie et assistant logiciel pour une ingénierie ontologique fondée sur la transformation d’un modèle semi-formel Soutenance de thèse de Michel Héon Direction : Gilbert Paquette et Josianne Basque 4 novembre 2010
Déroulement de la présentation • Introduction • Présentation d’OntoCASE • Démarche de construction d’OntoCASE • Validation d’OntoCASE • Conclusion
Impulsion qui m’a conduit à cette thèse Le transfert d’expertise dans les organisations soutenues par une instrumentation informatique intelligente
Introduction OntoCASE : À l’intersection de plusieurs domaines scientifiques
Déroulement de la présentation • Introduction • Présentation d’OntoCASE • Démarche de construction d’OntoCASE • Validation d’OntoCASE • Conclusion
Présentation d’OntoCASE OntoCASE :Caractéristiques informatiques • Conçue selon la technique du Développement conduit par les modèles (MDD) • S’harmonise avec les fonctionnalités développées dans le cadre du Eclipse Project (www.eclipse.org) • Permet : • l’édition graphique (éditeur eLi) de modèles MOT et MindMap • la formalisation guidée de modèles semi-formels (MSF) en ontologie OWL-1.0 • l’édition d’ontologie OWL dans les notations: N3, OWL, RDF/RDFS et autres • l’accès aux moteurs d’inférences : • Pour OWL : Jena, Pellet, Racer, SwiftOWLIM • Pour SWRL : Jena-Rules, Jess • la transformation d’ontologie OWL en code Java respectant le Protégé OWL-API • l’importation de modèle MOT+ en notation XML
Présentation d’OntoCASE OntoCASE :Caractéristiques de la méthodologie • S’inscrit dans les approches itérative et évolutive des méthodologies d’ingénierie ontologique (ex. : Methontology) et d’ingénierie logicielle (ex. : Rational UnifiedProcess) • Est appuyée par des modules intelligents et des interfaces qui offrent une convivialité d’utilisation de la méthodologie • Utilise une approche de construction d’ontologie en deux phases : • L’élicitationde la connaissance dans un formalisme graphique semi-formel relativement simple à utiliser par un expert de contenu • La formalisation en ontologie avec une assistance intelligente permettant la désambiguïsation du MSF et la validation par une rétroaction • Soutient la représentation formelle en ontologie de connaissance: déclarative, procédurale, stratégique et factuelle
Présentation d’OntoCASE Notion théorique Le cerveau humain arrive à décoder en partie, mais l’ordinateur arrive mal à le traiter Naturel Élevé C’est une forme restreinte et structurée du langage naturel, telle que celle que l’on retrouve dans la description d’algorithmes (pseudocode) ou encore dans les textes de loi Naturel Faible • Comparativement aux langages formels, ce degré de langage contient une certaine relâche des contraintes langagières qui favorise et stimule l'expressivité des connaissances et la communication entre humains. Artificiel Moyenne On le retrouve dans les langages comme OWL ou encore les GC de Sowa. Il offre une représentation des connaissances dont l'expressivité est réduite, mais qui en élimine les ambiguïtés, ce qui permet un traitement informatique des connaissances représentées. Artificiel Aucune La classification des langages de représentation des connaissances en quatre degrés de formalisme selon Uschold et Gruninger
Présentation d’OntoCASE Observations concernant les obstacles à la conception d’une ontologie Les connaissances tacites sont difficiles à éliciter La formalisation est une activité complexe nécessitant une expertise poussée La représentation ontologique est limitée à une forme déclarative alors qu’il existe des connaissances de nature diverse (déclarative, procédurale, stratégique) On constate un manque d’outils pour l’assistance à la conception d’ontologie
Présentation d’OntoCASE Avantages à utiliser un langage semi-formelpour l’élicitation de la connaissance • Convivialité • Simple à apprendre et à utiliser • Facilite l’expression de connaissances tacites • la spontanéité n’est pas bloquée par la charge cognitive associée à une formalisation plus poussée • Élargit le bassindes personnes aptes à représenter leurs connaissances • La sémantique du langage semi-formel fait en sorte que : • Le MSF peut être conçu par des experts de contenu sans l’assistance d’un ingénieur • La connaissance représentée est dans une forme pré-formalisée • Le modèle semi-formel peut être formalisé avec la participation minimale des experts les ayant conçus
Présentation d’OntoCASE Hypothèse : À partir d’un modèle de connaissances exprimé dans un langage semi-formel qui représente des connaissances de différents types, il est possible de procéder de manière automatique ou semi-automatique, à sa formalisation en ontologie qui, du point de vue du domaine de connaissance, est syntaxiquement et sémantiquement valide.
Produire un outil (méthodologique et informatique) permettant de formaliser un modèle semi-formel de connaissances (ex: MOT) en ontologie formelle dans le formalisme OWL Présentation d’OntoCASE But
Présentation d’OntoCASE Objectifs • Concevoir une méthodologie d'ingénierie ontologique intégrant une méthode fondée sur la transformation d'un modèle semi-formel en ontologie et intégrant une méthode: • de formalisation en ontologie • de validation syntaxique et sémantique de l’ontologie produite • Développer un outil informatique intelligent et intégré, qui instrumente de manière efficace, efficiente et satisfaisante ces différentes méthodes • Développer une ontologie offrant une représentation méta du domaine de la représentation des connaissances, qui opérationnalise les assistants informatiques de la méthodologie et qui sert de représentation pour la méthodologie
Présentation d’OntoCASE Les trois volets d’OntoCASE • Méthodologique • décrit l'ensemble des éléments procéduraux, des acteurs et des ressources contribuant à la formalisation d'un MSF en ontologie • Computationnel (informatique) • décrit les composants informatiques ainsi que leurs utilisations afin d'assister les acteurs dans l'application de la méthode • Représentationnel • comporte un ensemble de guides qui permettent d'orienter le déroulement de chacune des méthodes ainsi qu'une ontologie de transformation qui régit l'opérationnalité des composants du volet computationnel
Présentation d’OntoCASE Les relations entre les trois volets d’OntoCASE Les constituants du volet méthodologique Les constituants du volet computationnel Les constituants du volet représentationnel
Présentation d’OntoCASE Avant de poursuivre … Quelques éléments théoriques nécessaires au sujet de l’architecture conduite par les modèles (ACM)
Présentation d’OntoCASE/Théorie La métamodélisation et les niveaux d’abstraction de l’ACM • M0: couche donnée, représente les choses de la réalité • M1: couche modèle, abstraction de la réalité • M2: couche métamodèleabstraction du langage de modélisation • M3: couche Méta-métamodèle, abstraction du langage de métamodélisation
Présentation d’OntoCASE/Théorie Espaces de modélisation • L'espace de modélisation (EM) est une architecture de modélisation réalisée à partir d'un métamodèle particulier • L’espace MOF proposé par l’OMG • L’espaceExtended Backus-Naur Form (EBNF) qui est le méta-métamodèle servant à la définition de la grammaire du langage Java • L’espace RDFS associé au projet du web sémantique
Présentation d’OntoCASE/Théorie Transformation d’un modèle selon l’ACM • C’est production automatique d’un modèle cible à partir d’un modèle source • L’OMG préconise l’utilisation du MOF-QVT et l’OCL pour la transformation de modèles • Le processus de transformation est défini par le métamodèle MOF-QVT/OCL
Présentation d’OntoCASE/Théorie Principe de la transformation orthogonale • Le modèle source est traité en tant que données et le métamodèle source est reporté au niveau M1 • Le processus de transformation traite les éléments du modèle source en tant que données en correspondance avec la structure définie dans le métamodèle source selon les règles et axiomes définis dans le modèle de transformation • Le processus utilise la sémantique du langage source pour réaliser la transformation
Présentation d’OntoCASE/Théorie Adaptation d’ACM en architecture conduite par les ontologies (ACO) pour OntoCASE • L’ACM de base • Étape 1 Changement de l’espace de modélisation • MOF->RDF(S) • QVT/OCL->SWRL • Étape 2 Les modèles de M1 sont remplacés par des ontologies et la transformation est assumée par l’ontologie de transformation
Présentation d’OntoCASE … de retour au volet représentationnel d’OntoCASE • Quatre composants forment l'ontologie de transformation: • l'ontologie du langage semi-formelreprésente les éléments du vocabulaire et de la grammaire du langage semi-formel utilisé pour construire les modèles sources • l'ontologie de traitement des ambiguïtés et des erreurscontient des règles servant à la désambiguïsation et à l'identification des erreurs de catégorisation; • l'ontologie de référencereprésente les diverses catégories de connaissances et opérationnalise le processus de désambiguïsation et de transformation • l'ontologie cadreencadre les éléments du modèle cible dans une structure qui soutient la représentation de connaissances déclaratives, procédurales et stratégiques qu’elles soient concrètes ou abstraites
Présentation d’OntoCASE Positionnement des composantes de l’OT dans le modèle ACO
Présentation d’OntoCASE Structure de l’ontologie de référence Structure Entité-Relation
Quelques remarques: Rappel: l’O cadre sert à structurer l’ontologie cible. Elle est méta face à celle-ci La structure de l’O cadre diffère de celle de l’O de référence: les connaissances factuelles n’y figurent pas puisque ce type de connaissances sera représenté par des individus OWL dans l’ontologie cible Présentation d’OntoCASE Structure de l’ontologie cadre
Présentation d’OntoCASE OntoCASE :Le volet méthodologique
Présentation d’OntoCASE «1» Concevoir un modèle semi-formel
Présentation d’OntoCASE «2» Formaliser en ontologie du domaine
Présentation d’OntoCASE Module de traitement :Implantation de l’aspect méthodologique de la formalisation Ontologie du domaine (ontologie cible) Espace de modélisation RDF(S)-OWL :Berger-Allemand rdf:type owl:Class ; rdfs:subClassOf metaDom:MD_Declarative_Concept . Convertir :Bahia rdf:type :Berger-Allemand . Ontologie du MSF désambiguïsé :LienI_Berger-Allemand_Bahia rdf:type oRef:OR_Relation_Instance :Bahia rdf:typeoRef:OR_Entite_Manifestation_Objet :Berger-Allemand rdf:typeoRef:OR_Entite_Concept_Classe Formaliser Espace de modélisation EMOF MSF en langage natif (modèle source) Désambiguïser Ontologie du MSF :Bahia rdf:type metaMot:MOT_Exemple :Berger-Allemand rdf:type metaMot:MOT_Concept :LienI_Berger-Allemand_Bahiardf:type metaMot:MOT_LienI xsi:type="mot:Concept" nom="Berger Allemand" xsi:type="mot:LienI" xsi:type="mot:Exemple" nom="Bahia" Importer
Le but de la validation syntaxique est de s’assurer que tous les éléments du MSF sont représentés dans l’ontologie Le but de la validation sémantique est de s’assurer que l’ontologie représente correctement la signification du modèle Présentation d’OntoCASE «3» Valider
Présentation d’OntoCASE/Valider L’erreur de représentation survient quand le modélisateur … Conceptualisation Abstraire Extérioriser Par Langage Représenter Domaine de la réalité Modèle du domaine • ... fait une erreur d’abstraction (par exemple, il comprend mal le domaine de la réalité) … • … fait une erreur d’extériorisation, i.e. un usage inadéquat du langage de modélisation (son vocabulaire, sa grammaire ou sa sémantique)
Exemple de validation sémantique avec OntoCASE L’interprétation formelle d’une séquence d’actions Présentation d’OntoCASE/Valider Interprétation formelle La recette de la crème glacée [Ajouter le sucre] puis exécuter [Battre les œufs] [Ajoutez le lait] puis exécuter [Mettre au congélateur] [Battre les œufs] puis exécuter [Incorporer graduellement] [Chauffer le crème] puis exécuter [Incorporer graduellement] [Faire cuire] puis exécuter [Refroidir] [Hacher les noix] puis exécuter [Chauffer le crème] [Incorporer graduellement] puis exécuter [Faire cuire] [Refroidir] puis exécuter [Ajoutez le lait] [Séparer les œufs] puis exécuter [Ajouter le sucre] Portion de connaissances inférées ... [Faire cuire] a pour dépendance [Ajouter le sucre] [Faire cuire] a pour dépendance [Battre les œufs] [Faire cuire] a pour dépendance [Chauffer le crème] [Faire cuire] a pour dépendance [Hacher les noix] [Faire cuire] a pour dépendance [Incorporer graduellement] [Faire cuire] a pour dépendance [Séparer les œufs] [Faire cuire] permet [Ajoutez le lait] [Faire cuire] permet [Mettre au congélateur] [Faire cuire] permet [Refroidir] ...
Exemple de validation • L’erreur d’extériorisation La génération d’un MSF à partir de l’ontologie cible MSF Source MSF généré Formaliser • Les flèches en rouges indiquent les inférences produites par le mécanisme de validation sémantique • On constate l’erreur d’extériorisation dont la cause est l’inversion du « lien S » Valider Générer MSF
Introduction Présentation d’OntoCASE Démarche de construction d’OntoCASE Validation d’OntoCASE Conclusion Déroulement de la présentation
Construction d’OntoCASE Phase1 - Mise en place des composants architecturaux, procéduraux et informatiques de la méthodologie Pour fixer les composants informatiques en lien avec les composants méthodologiques Phase2 - Agrégation des composants ontologiques, procéduraux et informatiques d'OntoCASE Pour attacher les différents composants entre eux et de valider les choix architecturaux et théoriques Phase3 - Confirmation Pour compléter la structure interne des différentes ontologies agrégées par l'ontologie de transformation. Pour mettre en place les outils informatiques nécessaires à la validation d’OntoCASE par l'implantation de mécanismes d'exécution de scénarios de tests. La démarche de recherche se déroule selon une approche évolutive et itérative où les résultats et les outils de l’itération précédente servent à construire les outils produits par l’itération en cours. Le trois phases qui ponctuent la démarche
Construction d’OntoCASE Critères qui justifient le choix du langage semi-formel MOT: Permet l’expression de connaissances procédurale, déclarative et stratégique Permet l’expression de connaissances abstraites et factuelles Appuie dans sa sémantique l’expression de la relation d’instance et de spécialisation, ainsi que d’autres relations utiles telles que le séquencement procédural et la régulation N’impose aucune contrainte de représentation sur les types de connaissances ou de relations introduites dans un même modèle Le langage est de type graphique. Critères qui justifient le choix d’OWL en tant que langage formel: L’expressivité est suffisante pour représenter une ontologie Le langage est de degré formel La grande disponibilité des outils informatiques qui s’y rapporte (moteur d’inférence, éditeur, analyseur XML et Java) Phase 1: Critères de sélection du langage source (semi-formel) et du langage cible (formel)
Construction d’OntoCASE Phase 1: Étude du langage MOT
Construction d’OntoCASE Manuel: l’utilisateur peut choisir la sémantique qu’il désire donner à un élément du modèle Topologique: La sémantique de l’élément du modèle est déterminée par le système en fonction de la disposition des éléments du modèle Par exemple, soit le patron suivant: Alors: le principe sera désambiguïsé en propriété P le concept A et la concept B seront désambiguïsés en classe A et classe B et la classe A sera le domaine et la classe B sera l’image de la propriété P. Typologique: La sémantique de l’élément est choisie en fonction de son type. Ce type de désambiguïsation survient lorsque l’élément nepossède qu’une seule signification Par exemple: un lien I (instance) sera désambiguïsé en rdf:type Phase 1: Type de processus de désambiguïsation
Construction d’OntoCASE Les interfaces de communication permettent à l’utilisateur de diagnostiquer le processus de formalisation assurant ainsi une transformation efficiente Phase 2: Interfaces de communication avec l’utilisateur La rétroaction sur le graphique Des messages à la console L’accès aux propriétés d’un objet en erreur couplé à un mécanisme de pointage d’erreurs
Construction d’OntoCASE Le banc d’essais permet de valider les modules d’importation, de désambiguïsation, de conversion, de régénération de MSF ainsi que le module de validation syntaxique. Phase 3: Le banc d’essais pour la consolidation
Introduction Présentation d’OntoCASE Démarche de construction d’OntoCASE Validation d’OntoCASE Conclusion Déroulement de la présentation
Généralité des types de connaissances à formaliser Il s’agit de démontrer que les connaissances de divers types (déclarative, procédurale, stratégique et factuelle) présentes dans le MSF sont représentées dans l'ontologie cible Généricité des langages semi-formels utilisés pour la formalisation Cette dimension est démontrée en appliquant le scénario de transformation d’OntoCASE à partir d’un MSF construit à l’aide d’un autre langage que MOT, à savoir le langage MindMap de Buzan (1994) Ergonomie d’OntoCASE La validation ergonomique a pour objectif de valider la capacité d’OntoCASE à être utilisé par des utilisateurs autres que son concepteur. Requiert une expérimentation en laboratoire où des utilisateurs sont mis en situation d’utilisation. Validation d’OntoCASE OntoCASE est validé selon les trois aspects suivants:
Scénario de test unitaire Principalement conçu pour tester le processus de conversion Valide les éléments de base du langage semi-formel Utilise la désamb. manuelle Scénario de test fonctionnel Principalement conçu pour tester le module de désambiguïsation Valide le mécanisme d’identification des patrons de modélisation Utilise la désamb. topologique, typologique Scénario de test système Principalement conçu pour tester le module de validation Valide la préservation de la sémantique du MSF Utilise la désamb. manuelle, topologique et typologique Validation d’OntoCASE Généralité des types de connaissances:Les scénarios de test
Le thème et le sous-thème sont polysémiques puisqu’ils peuvent représenter des connaissances déclaratives ou procédurales La relation est aussi polysémique puisqu’elle peutreprésenter une hyperonymie (généralisation) ou une méronyme (composition) Validation d’OntoCASE Généricité des langages: Critères du choix du langage semi-formel MindMap
Le modèle descriptif, pour valider la transformation de connaissances déclaratives, de la généralisation et de la composition Le modèle procédural, pour valider la transformation de connaissances procédurales, de la généralisation et de la composition Validation d’OntoCASE Scénarios de tests pour évaluer l’intégration du MindMap dans OntoCASE Une automobile se compose de 4 roues, d'une carrosserie et d'un moteur. Un moteur peut être diesel, à essence ou électrique Pour écrire une thèse, il faut faire une recherche et aussi faire des activités comprises dans la procédure d’écriture d'un document, soit faire un plan, rédiger, corriger et réviser
Validation d’OntoCASE Méthode d’intégration
restauration en MOT du modèle descriptif restauration en MOT du modèle procédural Validation d’OntoCASE Résultat: Restauration en MOT des scénarios de test grâce à OntoCASE MindMap à MOT MindMap à MOT
Cette mise à l’essai a pour objectif de valider l’ergonomie d'OntoCASE en termes d'efficacité: degré de réalisation des objectifs poursuivis en matière d'utilisation; d'efficience: capacité de produire une tâche donnée avec le minimum d'effort de satisfaction: niveau de confort ressenti en utilisant le logiciel Elle a été menée auprès de quatre personnes déjà familières avec MOT: Expert de contenu Chargé de projets Cogniticien Ingénieur ontologique Elle suit une méthodologie de type: analyse en situation d'utilisation monitorage de l'utilisation Elle est menée conformément au certificat d’étique délivré par le comité d’éthique de la recherche de la TELUQ Validation d’OntoCASE Ergonomie d’OntoCASE: Mise à l’essai auprès d’usagers cibles
la familiarisation, afin d’initier le participant à l’utilisation OntoCASE la formalisation, afin d’initier le participant au processus de formalisation et de validation de modèles et de permettre à celui-ci de réaliser une première manipulation la modélisation et la formalisation libres, afin de mesurer la capacité du logiciel et de la méthodologie à résister aux différentes approches des participants par la modélisation d’un court texte le debriefing, est consacré au recueil des commentaires du participant à la fin de la séance Validation d’OntoCASE Les quatre phases de la séance individuelle de mise à l’essai
Durée moyenne des expérimentations: deux à trois heures Tous les participants ont déclaré qu’ils seraient aptes à utiliser OntoCASE avec un minimum de soutien de l’expérimentateur Les principales difficultés d’usages résident dans l’utilisation de l’éditeur de modèle MOT (eLi) pour la modélisation Tous les participants ont pu formaliser le modèle étalon Aucun participant n’a pu compléter la modélisation du texte servant d’intrant à la mise à l’essai: Le texte exigeait une longue réflexion avant d’être modélisé. Cependant, il a été observé que la formalisation en ontologie et la validation sémantique du modèle partiellement conçu ont permis aux participants d’accélérer leur processus de conception. Validation d’OntoCASE Bilan et commentaires