190 likes | 425 Views
Roma, 24 novembre 2005. Il web semantico: mito o realtà?. Marco Colombetti Politecnico di Milano e Università della Svizzera italiana. Il computer oggi. Fasi storiche dell’uso del computer: come strumento di calcolo scientifico e tecnico come strumento per la gestione di dati e archivi
E N D
Roma, 24 novembre 2005 Il web semantico: mito o realtà? Marco Colombetti Politecnico di Milanoe Università della Svizzera italiana
Il computer oggi • Fasi storiche dell’uso del computer: • come strumento di calcolo scientifico e tecnico • come strumento per la gestione di dati e archivi • come strumento per la comunicazione e l’interazione umana • Il passaggio alla terza fase è essenzialmente dovuto alla diffusione di internet e in particolare al web
Il web • Il web non è un insieme di documenti, è un insieme di luoghi disposti in un territorio virtuale • I luoghi del web sono punti d’ingresso per l’interazione fra individui e individui, fra individui e organizzazioni, fra organizzazioni e organizzazioni • Interazione: • scambio di informazioni e documenti • accesso a servizi: • commercio elettronico • amministrazione pubblica • formazione • salute • ...
Muoversi nel web • I problemi fondamentali del web: • trovare i luoghi pertinenti • sfruttare le informazioni e i servizi disponibili • I motori di ricerca sono essenziali per muoversi nel web ma stanno diventando rapidamente insufficienti: • di solito troppi risultati, per la maggior parte inutili • a volte nessun risultato • dipendenza del risultato dal vocabolario (ricerca per parole o sequenze di parole) • localizzazione di una pagina per volta
Un esempio • Una biblioteca intende acquistare un lotto di volumi sul web: • identificare i servizi di vendita • identificare l’offerta migliore • eseguire l’acquisto • monitorare il processo di evasione dell’ordine identificando eventuali problemi • Ipotesi di soluzione: • un agente software che accede direttamente alle informazioni e ai servizi disponibili sul web • Problema: • attualmente le informazioni e i servizi sul web sono pensati per l’accesso umano
Il web semantico • La soluzione: • il web semantico • Che cos’è il web semantico? • “A new form of Web content that is meaningful to computers” Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, Maggio 2001 • Ma che cosa significa? • consentire la localizzazione delle informazioni e dei servizi per concetti anziché per parole chiave • consentire la completa automazionedei servizi
I problemi da risolvere • Nel web semantico le informazioni e i servizi sono direttamente accessibili alle applicazioni software • Problemi: • definire formati standard per assicurare l’interoperabilitàdelle applicazioni • possibilità di eseguire ragionamenti deduttivi in modo completamente automatico a partire dalle informazioni disponibili
Formati standard • Superare le limitazioni di HTML • Alcuni standard per il web semantico sviluppati e sostenuti dal W3C (World Wide Web Consortium, http://www.w3.org): OWLWeb Ontology Language RDFResource Description Framework XMLExtensible Markup Language
Le deduzioni automatiche • L’utilizzo del web semantico richiede la capacità di dedurre automaticamente nuovi dati • Esempi: • cerco informazioni sui marsupiali il motore di ricerca semantico localizza una foto del lupo della tasmania in una pagina dove la parola ‘marsupiale’ non compare • voglio acquistare un vaso cinese il motore di ricerca semantico localizza tre aste elettroniche che trattano vasi cinesi e due spedizionieri specializzati nel trasporto di oggetti fragili
Logica descrittiva • I sistemi di ragionamento automatico si basano sulle tecniche sviluppate nell’ambito della logica formale e in particolare della logica descrittiva • La logica descrittiva consente di: • definire concetti e relazioni logiche fra concetti • gestire dati espressi nei termini dei concetti e delle relazioni logiche predefinite • rispondere a interrogazioni sulla base di ragionamenti deduttivi • L’uso di una logica descrittiva garantisce che tutte le interrogazioni poste a un ragionatore automatico ricevano risposta in tempo finito
Ontologie • La definizione formale di uninsieme di concetti con le loro relazioni logiche è chiamata ontologia • I linguaggi RDF e OWL (nelle versioni Lite, DL e Full) consentono di definire ontologie per il web semantico • Sono disponibili strumenti software per: • l’utilizzo di ontologie RDF o OWL da parte di applicazioni software (ad es. Jena) • la definizione e l’aggiornamento di ontologie RDF o OWL (ad es. Protégé) • l’esecuzione automatica di ragionamenti deduttivi in OWL DL (ad es. Racer)
Un esempio OWL DL: concetti e relazioni • Personee sesso: • ilsesso può essere ‘femmina’ o ‘maschio’ SESSO´ {f,m} • ilsesso si attribuisce alle persone Sesso:PERSONASESSO • ognipersona ha esattamente un sesso PERSONAv =1Sesso • unadonna è una persona di sesso femminile DONNAv 9Sesso.{f} • unuomo è una persona di sesso maschile UOMOv 9Sesso.{m}
Un esempio OWL DL: concetti e relazioni • Statocivile: • aogni persona si può associare una persona come coniuge Coniuge:PERSONAPERSONA • larelazione coniugale è simmetrica Coniuge–v Coniuge • ognipersona ha al più un coniuge (per volta...) PERSONAv ·1Coniuge • l’eventualeconiuge è una persona dell’altro sesso DONNAv 8Coniuge.UOMO UOMOv 8Coniuge.DONNA • uncelibe è una persona priva di coniuge CELIBEv PERSONAu :9Coniuge • ...
Un esempio OWL DL: dati e deduzioni • Dati: • P0036è coniugato con P0145 Coniuge(P0036,P0145) • P0036è una donna DONNA(P0036) • Alcunededuzioni automatiche possibili: • P0036è una persona PERSONA(P0036) • P0036è di sesso femminile Sesso(P0036,f) • P0145è una persona PERSONA(P0145) • P0145è un uomo UOMO(P0036) • P0145è di sesso maschile Sesso(P0145,m) • P0145è coniugato con P0036 Coniuge(P0145,P0036) • P0036e P0145 non sono celibi :CELIBE(P0036):CELIBE(P0145) • ...
Limiti del web semantico • Come ogni tecnologia, anche il web semantico ha i suoi limiti • Ecco alcuni fatti da non scordare: • i computer non capiscono i concetti che manipolano: si limitano ad applicare ciecamente le definizioni • i concetti umani hanno sfumature che è praticamente impossibile tradurre in definizioni formali • anche se è garantita la conclusione dei ragionamenti in tempo finito, a volte possono essere necessarie ingenti risorse di calcolo • gli attuali linguaggi per definire ontologie non consentono di dire tutto ciò che si vuole, e alcuni limiti espressivi della logica descrittiva non potranno essere superati
Conclusioni • Con tutti i loro limiti, le tecnologie del web semantico sono potenti e potenzialmente utilissime • Ci sono attualmente quasi tutte le condizioni per l’adozione di queste tecnologie da parte delle imprese e delle amministrazioni pubbliche: • le tecnologie sono mature • sono disponibili gli strumenti necessari a costi accessibili • sussiste una forte esigenza socio-economica di realizzare i servizi resi possibili dal web semantico • Tuttavia, è ancora insufficiente la diffusione delle competenze tecniche necessarie
Per saperne di più • T. Berners-Lee, J. Hendler, O. Lassila. The semantic web, Scientific American, Maggio 2001 Reperibile dal sito del W3C, www.w3.org, link “Semantic Web” • G. Antoniou, F. Van Harmelen. A semantic web primer, MIT Press, Cambridge, MA. • Materiale dal sito del corso di Ingegneria della conoscenza del Politecnico di Milano: http://www.elet.polimi.it/upload/colombet/IC_2005/index.html