450 likes | 599 Views
INFORMATICA UMANISTICA B. RAPPRESENTAZIONE DELLA CONOSCENZA ONTOLOGIE SEMANTIC WEB. RAPPRESENTAZIONE DELLA CONOSCENZA ED ONTOLOGIE.
E N D
INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLA CONOSCENZA ONTOLOGIE SEMANTIC WEB
RAPPRESENTAZIONE DELLA CONOSCENZA ED ONTOLOGIE • La ricerca sul modo ‘ideale’ per rappresentare le informazioni nelle basi di dati e in intelligenza artificiale ha portato alla nascita di ricerca sulla KNOWLEDGE ENGINEERING o rappresentazione della conoscenza anche in senso non applicato • Particolarmente interessante per domini piu’ complessi che ‘studenti’ e gli ‘esami’ • Quest’area si focalizza sulle ONTOLOGIE • Ontologie base teorica del lavoro sul • Ontologie applicate in domini come la medicina • Il SEMANTIC WEB
RAPPRESENTAZIONE DELLA CONOSCENZA IN INFORMATICA • In informatica sono stati sviluppati numerosi modelli della rappresentazione della conoscenza • TESAURI • Modelli concettuali sviluppati per le basi di dati • RETI SEMANTICHE e TASSONOMIE • ONTOLOGIE
TESAURI • Rappresentazioni di ASSOCIAZIONI tra parole • Tipicamente raggruppate in CATEGORIE
RETI SEMANTICHE E TASSONOMIE • Rappresentazioni in cui • Vengono identificate relazioni come nei modelli concettuali • Viene anche rappresentata informazione TASSONOMICA • Si esprimono anche RESTRIZIONI su relazioni
DESCRIPTION LOGICS • Una famiglia di logiche che permettono di descrivere reti semantiche specificando oltre che informazioni su relazioni e tassonomie anche • COMPLEMENTARITA: MALE e FEMALE sono disgiunti • CARDINALITA’: una bici ha 2 ruote, un’auto ne ha 4 • etc
ONTOLOGIE IN INFORMATICA In FILOSOFIA, ONTOLOGIA e’ lo studio di cio’ che esiste – una delle aree piu’ importanti della METAFISICA In INFORMATICA, un’ ONTOLOGIA e’ una DEFINIZIONE dei TERMINI usati in un certo dominio e delle relazioni tra di loro
Concepts and definitions “Philosophers have long assumed that definitions are the appropriate way of characterizing word meaning and category membership” (MU, ch.2, p.11)
Aristotle’s Metaphysics,Book Z “a definition is an account, and every account has parts, and part of the account stands to part of the thing in just the same way that the whole account stands to the whole thing” = Most concepts encode necessary and sufficient conditions for their own application
DEFINIENDUM Aristotle’s Metaphysics:Definitions MAN = RATIONAL ANIMAL DEFINIENS
Definition by genus and differentia • The ‘method of division’: • Begin with the broadest genus containing the species to be defined (‘ANIMAL’) • Divide the genus in two sub-parts by some differentia (‘FOOTED’) • Then divide the two sub-types again (CLOVEN-FOOTED)
Other philosophers The greatest part of the Ideas, that make our complex Idea of GOLD, are YELLOWNESS, great WEIGHT, FUSIBILITY, and SOLUBILITY IN AQUA REGIA (Locke) In the case of many words … it is possible to specify their meaning by reference to other words. E.g., “ARTHROPODES” are ANIMALS with SEGMENTED BODIES and JOINTED LEGS. (Carnap)
Other philosophers The English noun “chair” can be decomposed into a set of concepts which might be represented by the semantic markers: OBJECT, PHYSICAL, NON-LIVING, ARTIFACT, FURNITURE, PORTABLE, SOMETHING WITH LEGS, SOMETHING WITH A BACK, SEAT FOR ONE(Katz)
The classical theory in a nutshell (Most) concept descriptions are structured mental representations that encode a set of NECESSARY and SUFFICIENT conditions for membership in the category These descriptions are learned through a process of ABSTRACTION by eliminating those properties which are not shared by all members of a category (Locke)
Disegno di ontologie • Identificazione dei CONCETTI • Identificazione dei loro ATTRIBUTI • Identificazione delle relazioni di dipendenza tra questi concetti e di restrizioni, usando description logics o linguaggi logici piu’ potenti
ONTOLOGIA IN INFORMATICA • Un artefatto progettato con lo scopo di esprimere ilsignificato intesodi un vocabolario (condiviso) • Un vocabulario condiviso più una specificazione (caratterizzazione) del suo significato inteso • “An ontology is a specification of a conceptualization” • [Gruber 95] • cioè, un’ontologia rende conto dell’impegno di un linguaggio verso una certa concettualizzazione
ONTOLOGIA APPLICATA IN INFORMATICA • Interoperabilità Semantica • Integrazione di Database • Imprese Virtuali • Concurrent engineering • e-commerce • Web services • Information Retrieval • Distinguere il vocabolario dell’utente da quello dei dati • Rispondere alle Query su insiemi di documenti • Natural Language Processing
ONTOLOGIE NELL’AMBITO DELLA BIOLOGIA • Protein Ontology: un’ontologia sviluppata per codificare la nostra conoscenza sulle proteine in modo sistematico • http://pir.georgetown.edu/pro/ • Altre ontologie elencate sul sito OPEN BIOMEDICAL ONTOLOGY • http://www.obofoundry.org/ • Gene ontology, C. elegans, etc
ALTRI DOMINI IN CUI VENGONO USATE ONTOLOGIE • Geografia (per scambiare informazioni tra sistemi satellitari etc) • Software • Specifica di processi (management) • PSL: http://www.mel.nist.gov/psl/
Ontologie ‘generali’ ed ontologie ‘di dominio’ • Esistono ora molte ontologie per domini specifici • Esistono anche tentativi di ‘riunificare’ queste ontologie tramite cosiddette ‘ontologie di livello superiore’ • SUMO • DOLCE
DOLCE • Ontologia generale sviluppata dal Laboratorio di Ontologia Applicata del CNR (LOA)
PT Particular ED Endurant PD Perdurant Q Quality AB Abstract PED Physical Endurant NPED Non-physical Endurant AS Arbitrary Sum EV Event STV Stative TQ Temporal Quality PQ Physical Quality AQ Abstract Quality … Fact Set R Region M Amount of Matter F Feature POB Physical Object … NPOB Non-physical Object ACH Achievement ACC Accomplishment ST State PRO Process TL Temporal Location … … SL Spatial Location … TR Temporal Region PR Physical Region AR Abstract Region … … … … … T Time Interval … S Space Region … APO Agentive Physical Object NAPO Non-agentive Physical Object MOB Mental Object SOB Social Object ASO Agentive Social Object NASO Non-agentive Social Object SAG Social Agent SC Society La tassonomia di DOLCE
Scelte Ontologiche di base in DOLCE (1) • Oggetti (Enduranti o Continuanti) ed Eventi(Perduranti o Occorrenti) queste sono categorie distinte connesse attraverso la relazione di partecipazione. • Le Qualità formano una categoriaesse ineriscono agli Oggetti (Qualità Fisiche) o agli Eventi (Qualità Temporali) e corrispondono a “proprietà individualizzate”, cioè sono inerenti solo a una specifica entità , per esempio “il colore di questa particolare rosa”, “la velocità di questo movimento”, ecc.
Scelte Ontologiche di base in DOLCE (2) • Ogni tipo di Qualità è associato a uno Spazio di Qualità che rappresenta lo spazio dei valori che le qualità(di uno specifico tipo) possono assumere.Gli spazi di qualità non sono né nello spazio né nel tempo, ma sono ammessi diversi spazi di qualità associati allo stesso tipo di Qualità. • Spazio e Tempo sono specifici spazi di qualità; • Sono ammessi diversi tipo di spazio e tempo. • Diversi Oggetti/Eventi possono essere co-localizzati spazio-temporalmente: in questo caso si considera la relazione di costituzione.
Entità Astratte vs. Concrete • Concrete: collocate nello spazio-tempo(le regioni di spazio-tempo sono collocate in se stesse) • Astratte (questo termine può avere due significati): - Resultato di un processo di astrazione (qualcosa di comune a molte esemplificazioni) - Non collocato nello spazio-tempo(questo è il sognificato in DOLCE) • Somme mereologiche (di entità cocnrete) sono concrete, gli insiemi che corrispondono a esse sono astratti...
Enduranti vs. Perduranti • Enduranti: • Tutte le loro parti proprie sono presenti ogni volta che essi sono presenti (interamente presenti, non attraverso le loro parti temporali) • Esistono nel tempo • Possono genuinamente cambiare nel tempo • Possono avere parti non essenziali • La relazione di parte sugli endurtanti include un argomento temporale • Perduranti: • Solo alcune delle loro parti proprie sono presenti ogni volta che essi sono presenti (presenza parziale, parti temporali) • Accadono nel tempo • Non cambiano nel tempo • Tutte le loro parti sono essenziali • La relazione di parte sui perduranti non considera il tempo
SEMANTIC WEB • Il Semantic Web (Berners-Lee Hendler et al 2001) e’ un progetto per realizzare una versione del Web in cui i testi sono annotati SEMANTICAMENTE e quindi e’ possibile ritrovarli sulla base del CONTENUTO invece che di keywords
INGREDIENTI DEL SEMANTIC WEB • XML come linguaggio di markup, ed in particolare • URI per identificare nomi • namespaces • RDF per la rappresentazione di informazioni • OWL (Web Ontology Language) per rappresentare concetti, attributi, e relazioni • Una o piu’ ontologie
URI ed URL • URL: indirizzo fisico • URI: indirizzo ‘concettuale’
RESOURCE DESCRIPTION FRAMEWORK (RDF) • Linguaggio per esprimere asserzioni del tipo <RISORSA, PROPRIETA’, VALORE> ‘Il presidente Ciampi vive a Roma’
ESEMPIO DI RDF <?xml version='1.0'?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:wikipedia="http://it.wikipedia.org/wiki/" xmlns:wikidizionario="http://it.wiktionary.org/wiki/"> <rdf:Description rdf:about="http://www.quirinale.it/presidente/ciampi.htm"> <wikidizionario:vivere rdf:resource="http://www.comune.roma.it/index.asp"/> <wikipedia:codice_fiscale> CMPCLZ20T09E625V </wikipedia:codice_fiscale> </rdf:Description> </rdf:RDF>
OWL: LINGUAGGIO PER DESCRIVERE ONTOLOGIE • Una serie di linguaggi che permettono di descrivere ontologie piu’ sofisticate • OWL-LITE: tassonomie, restrizioni • OWL-DL: livello delle description logics • OWL-FULL: massima espressivita’ (logica)
OWL <owl:Class rdf:ID="ProteinComplex"> <owl:disjointWith> <owl:Class rdf:ID="SiteGroup"/> </owl:disjointWith> <owl:disjointWith> <owl:Class rdf:about="#Chains"/> </owl:disjointWith> <owl:disjointWith> <owl:Class rdf:about="#Residues"/> </owl:disjointWith>
JIM HENDLER’S PAGE, SEMANTIC WEB INFO <BODY> <INSTANCE KEY="http://www.cs.umd.edu/users/hendler/"> <USE-ONTOLOGY ID="cs-dept-ontology" VERSION="1.0" PREFIX="cs" URL= "http://www.cs.umd.edu/projects/plus/SHOE/cs.html" /> <CATEGORY NAME="cs.Professor" FOR="http://www.cs.umd.edu/users/hendler/"/> <RELATION NAME="cs.member"> <ARG POS=1 VALUE="http://www.cs.umd.edu/projects/plus/"> <ARG POS=2 VALUE="http://www.cs.umd.edu/users/hendler/"> </RELATION> <RELATION NAME="cs.name"> <ARG POS=2 VALUE="Dr. James Hendler"> </RELATION> <RELATION NAME="cs.doctoralDegreeFrom"> <ARG POS=1 VALUE="http://www.cs.umd.edu/users/hendler/"> <ARG POS=2 VALUE="http://www.brown.edu"> </RELATION> <RELATION NAME="cs.emailAddress"> <ARG POS=2 VALUE="hendler@cs.umd.edu"> </RELATION> …..</INSTANCE> <b>As of January 1, 2007 Professor Hendler has moved from the University of Maryland to <a href="http://www.rpi.edu">Rensselaer Polytechnic Institute</a></b>.
VALUTAZIONE • L’uso di ontologie in informatica e’ ancora controverso • In alcune aree come la biomedicina chiaramente utili ed utilizzate • In altre aree meno chiaro • Semantic Web compreso
RIASSUNTO CONCETTI FONDAMENTALI • Forme di organizzazione della conoscenza in informatica: tesauri, reti semantiche, ontologie • Ontologie: filosoficamente, applicazioni informatiche, di dominio / generali • Semantic Web: RDF, OWL
LETTURE • Tomasi, capitolo 8 • Wikipedia • Ontologie: • http://www.ontologyportal.org/ • http://www.loa-cnr.it/ • Semantic Web: • http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21