190 likes | 302 Views
Projet R.N.T.L. e.Dot – Entrepôts de Données Ouverts sur la Toile – Organisation et Structuration de l’Entrepôt LOT 3 4 juillet 2005. http://www-rocq.inria.fr/verso/edot/. Introduction. Implication de tous les partenaires Définition des modules
E N D
Projet R.N.T.L. e.Dot–Entrepôts de Données Ouverts sur la Toile–Organisation et Structuration de l’EntrepôtLOT 34 juillet 2005 http://www-rocq.inria.fr/verso/edot/ e.Dot – juillet 2005
Introduction • Implication de tous les partenaires • Définition des modules • Mise en place des modules / fonctionnalités de manière indépendante • Définition d’interfaces WSDL • Pilotage par l’INRIA • Mise en œuvre d’une plateforme de développement (AXML / ACWAre) • Architecture • 3 thésards, ~10 stagiaires maîtrise (AXML / ACWAre) e.Dot – juillet 2005
Plan • Principes • Architecture Globale • Un exemple de service • Dissémination • Démonstration e.Dot – juillet 2005
1. Principes e.Dot – juillet 2005
Des standards très répandus • XML • Format d’échange standard de données • Mariage entre documents et bases de données • Gestion de données semi-structurées • Bien adapté à l’utilisation du Web et de données évolutives • Services Web • Standard pour le développement modulaire d’applications distribuées (SOAP) • Description standardisée des entrées/sorties (WSDL) • Dialecte XML e.Dot – juillet 2005
Des technologies nouvelles • Active XML • Plateforme de développement intégrant données XML et Services Web • Mariage entre documents et fonctions • Basé sur les standards XML, XSL… • Évolutif et en évolution ! • Active Content Warehousing • Simplifie la gestion de l’architecture d’un entrepôt semi-structuré • Application AXML • Utilisable de manière modulaire e.Dot – juillet 2005
Un entrepôt « actif » • Données évolutives • Utilisation d’un mécanisme d’enrichissement • Résultats utilisables par d’autres services (ex. Ontologie) • Services flexibles • Choix de services parmi les fonctionnalités (ex. crawler) • Intégration à divers niveaux • Possibilité de connecter des sources de données, si celles-ci sont des services web (ex. Aqweb) e.Dot – juillet 2005
Designer Crée Spec. Formelle Viewer Builder Génère l’entrepôt et les connexions Services Exportés Entrepôt XML Service 1 Manager Interroge Service 2 Génération de l’entrepôt e.Dot – juillet 2005
Appel de Services e.Dot – juillet 2005
2. Architecture Globale e.Dot – juillet 2005
Principe • Entrepôt de travail • Espace de travail persistant et partagé par tous les services d’acquisition et d’enrichissement de données • Stockage des données en XML • Géré par Acware • Plusieurs espaces de travail possibles (EdotFilter, Aqweb,…) • Entrepôt final • Données de l’entrepôt de travail validées et enrichies sémantiquement • Interrogeables via MIEL++ • Stocké dans Xylème e.Dot – juillet 2005
Architecture Globale e.Dot – juillet 2005
Architecture Modulaire • Acquisition • Traitement de divers types de données • Html : EDotFilter • Pdf : PDFCrawler • Informations sémantiques centralisées • OntoMap • Enrichissement • Intégré à certaines parties (crawlers) • Utilisation possible de services externes (thesus) • Stockage et interrogation • L’entrepôt de travail n’est pas l’entrepôt interrogé, il permet seulement le transit de certaines informations • Utilisation de Xylème comme entrepôt final • Interrogation unifiée via Miel++ e.Dot – juillet 2005
Any2XTab ontologie ontologie HTML2XTab documents (html,pdf,…) document XML (intermédiaire) document SML (XML sémantique) PDF2XTab XTAB2SML EXCEL2XTab Illustration : la conversion vers SML e.Dot – juillet 2005
3. Un exemple de service e.Dot – juillet 2005
Disponible sur le site • Les Spécifications WSDL • Exemples : • EDotFilter • Any2XTab e.Dot – juillet 2005
4. Dissémination e.Dot – juillet 2005
Publications • S. Abiteboul, V. Bensal, G. Cobena, B. Nguyen and A. Poggi, Model, Design and Construction of a Service-oriented Web Warehouse Demonstration at the European Conference on Digital Libraries, Trondheim (Norway), 2003 • S. Abiteboul, B. Nguyen, G. Ruberg, Building an Active Content Warehouse, in Processing and Managing Complex Data for Decision Support, IDEA Goup, J Darmont & O. Bensaid ed., à paraître (2005) • T. Milo, S. Abiteboul, B. Amann, O. Benjelloun, F. Dang Ngoc, Exchanging Intensional XML Data, SIGMOD 2003 e.Dot – juillet 2005
4. Démonstration e.Dot – juillet 2005