190 likes | 369 Views
Sommario. Il Web Semantico Le ontologie La dinamica delle ontologie Il sistema MOMIS L’inserimento di nuove sorgenti Conclusioni. Osservazioni Grande quantità di informazioni Difficoltà nel selezionare le informazioni interessanti Uso di HTML non comprensibile dai calcolatori.
E N D
Sommario • Il Web Semantico • Le ontologie • La dinamica delle ontologie • Il sistema MOMIS • L’inserimento di nuove sorgenti • Conclusioni
Osservazioni • Grande quantità di informazioni • Difficoltà nel selezionare le informazioni interessanti • Uso di HTML non comprensibile dai calcolatori Conoscenze di base e conoscenza specifica del dominio (interpretazione) click Il WWW oggi La ricerca di informazioni in rete…
annotazione Ontologia (interpretazione) annotazione (istruzioni) (risultati) Il Web Semantico Il WWW domani La ricerca di informazioni in rete… AGENTE
Il Web Semantico “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” “The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents, roaming from page to page, can readily carry out sophisticated tasks for users.” [Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001] • Elementi chiave: • Rappresentazione della conoscenza • Agenti • Ontologie
Il Web Semantico Agenti • Sono componenti software con le seguenti proprietà: • autonomia • reattività • pro-attività • abilità sociali [M. Wooldridge and N.R. Jennings. Intelligent agents: Theories and practice. The Knowledge Engineering Review.] • Raccolgono contenuti dal Web da diverse sorgenti • Elaborano informazioni • Scambiano i risultati con altri programmi
Il Web Semantico Ontologie • “An ontology is an explicit specification of a conceptualization.”[Tom Gruber] • Idea di fondo delle ontologie: • descrizione di un particolare dominio, • da un certo punto di vista, • descrizione esplicita, • costruzione di un vocabolario per quel dominio, • un gruppo usa il vocabolario per accordarsi sul significato dei termini usati, • fondamentale per la comunicazione.
Dinamica delle Ontologie • Le ontologie evolvono durante il loro ciclo di vita a causa di: • cambiamenti nel dominio • cambiamenti nella concettualizzazione condivisa • cambiamenti nell’espressione, specificazione • nuovi requisiti
Strumenti per lo sviluppo OILEd OntoEdit Protégé-2000 WebODE Strumenti per l’integrazione e la fusione Chimaera PROMPT ODEMerge FCA-Merge Strumenti per la gestione delle Ontologie Osservazioni • Forniscono soluzioni parziali • Hanno approcci diversi • Hanno diverse funzionalità • Hanno differenti capacità di aiutare l’utente
MOMIS • MOMISMediator envirOnment for Multiple Information Sources è un sistema intelligente per l’integrazione di dati eterogenei e distribuiti. • Principali caratteristiche: • “Approccio semantico” all’integrazione • Common Thesaurus • Global Virtual View (GVV) • Interrogazioni sulla Global Virtual View • Un modello dei dati comune – ODMI3 • Un linguaggio per descrivere gli schemi delle sorgenti ODLI3(Object Definition Language) http://www.dbgroup.unimo.it/Momis
SI-Designer Integration Integration Designer Designer • SLIM WordNet interaction WordNet • SLIM WordNet interaction WordNet • SIM ODB-Tools validation • SIM ODB-Tools validation • ARTEMIS Clustering • ARTEMIS Clustering • TUNIM Map. table tuning • TUNIM Map. table tuning Global Schema Builder creates ODB- Tools ODB- Tools Global Schema Global Schema Service level METADATA REPOSITORY User METADATA REPOSITORY User Application QueryManager USER level QueryManager MOMIS mediator legenda User interaction Wrapper Wrapper Wrapper Wrapper Wrapper Wrapper Wrapper Wrapper CORBA interaction CORBA Object Relational XML Object generic Relational XML Object generic GUI Source Source Source Source Source Source Source Source User Data level Software tools MOMIS – Architettura
XML <interface> <name=“student”> Schemi Sorgenti ODLI3 Common Thesaurus Calcolo Cluster GloblalClass1 GloblalClass2 Global Virtual View GVV OODB GloblalClass3 RDB Mapping tra Schema Globale/ Schemi Locali Processo di integrazione Common Thesaurus • relazioni intra/inter schema • relazioni lessicali • (annotazione schemi sorgenti) • relazioni inserite dall’utente • relazioni inferite • Tipi di rel.: SYN, NT, BT, RT. • Es: CS.Course SYN UNI.Section
MOMIS e la dinamica • La gestione della dinamica consiste nella capacità di far fronte a: • inserimento di nuove sorgenti, • aggiornamento o • cancellazione di sorgenti già integrate. • MOMIS non è in grado di gestire la dinamica. • Nella tesi si è affrontato il problema dell’inserimento di nuove sorgenti nel sistema.
Annotazione della GVV • La GVV deve essere annotata per aumentarne il potere espressivo. • La fase di annotazione assegna agli elementi dello schema globale (classi e attributi) un nome e almeno un significato. • Sono stati individuati i casi che si possono verificare per rendere il più possibile automatico il processo. • L’annotazione viene eseguita rispetto al DB lessicale WordNet (www.cogsci.princeton.edu/~wn/).
La classe globale GlobalClass1 CS.Essay CS.Publication UNI.Article La classe globale annotata significati GlobalClass1 = <publication, {essay#1,publication#2, article#1}> essay#1 = an analytic or interpretive literary composition publication#2 = a copy of a printed work offered for distribution article#1 = nonfictional prose forming an independent part of a publication nome forma base senso Annotazione della GVV Le classi locali annotate CS.Essay=<essay, {essay#1}> CS.Publication=<publication,{publication#2}> UNI.Article=<article,{article#1}> Le relazioni nel CT
Schemi Sorgenti ODLI3 Common Thesaurus Calcolo Cluster GloblalClass1 GloblalClass2 Nuova GVV OODB GloblalClass3 RDB Mapping tra Schema Globale/ Schemi Locali Nuovo processo di integrazione GVV annotata Common Thesaurus • relazioni intra/inter schema • (solo nuove sorgenti) • relazioni lessicali • (GVV e nuove sorgenti annotate) • relazioni inserite dall’utente • relazioni inferite XML Nuova Nuova
Vantaggi – Svantaggi • Vantaggi • Il processo non riparte da scratch • Il processo sfrutta le conoscenze delle precedenti sessioni di integrazione • Riduzione dei tempi di integrazione • Riduzione degli effetti collaterali, preservando il più possibile lo schema precedente • La metodologia di MOMIS viene conservata • Svantaggi • La GVV deve essere annotata • Gli errori delle precedenti sessioni si possono propagare • Possibile scarsa rappresentatività del dominio integrato • Riduzione dell’espressività dopo diverse sessioni di integrazione
Conclusioni • Difficoltà nell’implementazione del Web Semantico • La comunità scientifica non ha adottato una linea comune (linguaggi, strumenti, progetti) • Difficoltà nella gestione della dinamica delle ontologie • Estensione di MOMIS per la gestione dell’inserimento di nuove sorgenti • Sviluppo del codice per l’estensione del sistema • Futura estensione della gestione ai casi di modifica e cancellazione di sorgenti già integrate • Integrazione del lavoro svolto nel progetto SEWASIE
SEWASIE • SEWASIE (Semantic Webs and AgentS in Integrated Economies) è un progetto finanziato dalla Commissione Europea(Maggio 2002/Aprile 2005). • Goal: progettare e implementare un motore di ricerca avanzato basato sulla semantica. • I partecipanti: • Università degli Studi di Modena e Reggio Emilia (ITALY) • CNA SERVIZI Modena s.c.a.r.l. (ITALY) • Università degli Studi di Roma “La Sapienza” (ITALY) • Rheinisch Westfaelische Technische Hochschule Aachen (GERMANY) • Libera Università di Bolzano (ITALY) • Thinking Networks AG (GERMANY) • Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein (GERMANY) • IBM Italia SPA (ITALY) • Il sito web: http://www.sewasie.org/