240 likes | 369 Views
OWL>. OWL. „Ťažká“ či „ľahká“ sémantika?. To je otázka. Michal Tvarože k, tvarozek { at } f iit.stuba.sk , D208. O čom to bude. Teoretická časť Čo/kde je sémantika (na webe) a k čomu je dobrá Ako reprezentovať sémantiku Čo je ontológia Praktická časť
E N D
OWL> OWL „Ťažká“ či „ľahká“ sémantika? To je otázka... Michal Tvarožek, tvarozek { at } fiit.stuba.sk, D208
O čom to bude... „Ťažká“ či „ľahká“ sémantika? To je otázka... • Teoretická časť • Čo/kde je sémantika (na webe) a k čomu je dobrá • Ako reprezentovať sémantiku • Čo je ontológia • Praktická časť • Aké nástroje použiť na prácu s ontológiou • Kde/ako možno nejaké nájsť • Kde/ako ukladať ontológie
Čo je sémantika? „Ťažká“ či „ľahká“ sémantika? To je otázka... • Údaje informácie (údaje s významom) • Reťazce vs. jedinečné zdroje • M. Barla, Michal Barla…vs. http://fiit.stuba.sk#barla • Sémantika na webe vs. Web so sémantikou • Microformats, tagy, … vs. ontológie
Prečo „potrebujeme“ sémantiku? „Ťažká“ či „ľahká“ sémantika? To je otázka... Štandardný zápis informácií a znalostí Umožňuje strojové spracovanie informácií Nutná pre interoperabilitu aplikácií, dátovú integráciu Podporuje odvodzovanie nových informácií/znalostí Vyhľadávanie so sémantikou
Reprezentácia: „silná“, či „slabá“? „Ťažká“ či „ľahká“ sémantika? To je otázka...
Čo je ontológia? „Ťažká“ či „ľahká“ sémantika? To je otázka... • Opis konceptov a vzťahov medzi nimi (v danej doméne) • Oficiálna definícia: • Explicitná formálna špecifikácia zdieľanej konceptualizácie • Zápis: XML a W3C štandardy a odporúčania • RDF, RDFS, OWL (Lite, DL, Full) , OWL2(EL, QL, RL) • Trojice: SUBJEKT-PREDIKÁT-OBJEKT<MiT> <ma-spolocnu-kancelariu-s> <MiB> • Slovník: class, instance, property, collections, annotations, ... • Reštrikcie: musí mať vlastnosť X, kardinalita najviac Y, ...
Web so sémantikou dnes – LinkedData Prebrané z linkeddata.org „Ťažká“ či „ľahká“ sémantika? To je otázka...
Vrstvy webu so sémantikou „Ťažká“ či „ľahká“ sémantika? To je otázka...
Ontológie opisujú zdroje (Resource) „Ťažká“ či „ľahká“ sémantika? To je otázka... • Jedinečné „zložité“ objekty (reálneho) sveta • Navzájom môžu byť poprepájané vzťahmi • Označujeme ich pomocou URI • http://mirai.fiit.stuba.sk/ontologies/image.owl#Person • Namespace: http://mirai.fiit.stuba.sk/ontologies/image.owl • LocalName: #Person • S prefixom: i:Person • Literály • Jednoduché dáta asociované s konkrétnym zdrojom • Čísla, textové reťazce, dátumy, ...
Z čoho pozostáva ontológia? „Ťažká“ či „ľahká“ sémantika? To je otázka... • Spôsob reprezentácie znalostí pomocou • Tried – množín/skupín konceptov alebo typov objektov • Indivíduí – objektov/inštancií tried • Atribútov – charakteristík objektov • Vzťahov – súvislostí medzi triedami a indivíduami • Ohraničení – požiadaviek, ktoré musia byť splnené • Pravidiel – spôsobov odvodzovania nových znalostí
Jednoduchá ontológia publikácií „Ťažká“ či „ľahká“ sémantika? To je otázka...
Reprezentácia pomocou RDF „Ťažká“ či „ľahká“ sémantika? To je otázka... <?xmlversion="1.0"encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:pub="http://fiit.stuba.sk/publication#" xmlns:pub="http://www.w3.org/2001/XMLSchema#"> <rdf:Descriptionrdf:about="http://fiit.stuba.sk/publication#Person"> <rdf:typerdf:resource="http://www.w3.org/2002/07/owl#Class"/> <rdfs:labelxml:lang="en">Person</rdfs:label> <rdfs:labelxml:lang="sk">Osoba</rdfs:label> </rdf:Description> <rdf:Descriptionrdf:about="http://fiit.stuba.sk/publication#Person_2"> <rdf:typerdf:resource="http://fiit.stuba.sk/publication#Person"/> <pub:namerdf:datatype="xsd:string">Jana</pub:name> <pub:surnamerdf:datatype="xsd:string">Pekná</pub:surname> <pub:agerdf:datatype="xsd:int">25</pub:age> </rdf:Description> </rdf:RDF>
Kde možno nájsť ontológie? „Ťažká“ či „ľahká“ sémantika? To je otázka... • V ontologickom úložisku • Dostupné cez API alebo SPARQL endpoint • Voľne dostupné ako súbor na webe • Pripojené k nejakej webovej stránke • Cez elementy meta alebo link v hlavičke HTML • Prepojené dáta (LinkedData) • Distribuované uloženie (fragmentov) ontológií • Prístup pomocou dereferencovania URI • Zoznam (funkčných?) SPARQL endpointov:http://esw.w3.org/topic/SparqlEndpoints
Ontologické úložiská (databázy) „Ťažká“ či „ľahká“ sémantika? To je otázka... • Sesame[openrdf.org], opensource v Jave • 1.2.x – dostupné cez Java API, SeRQL, ... • 2.x – dostupné cez Java API, SPARQL (endpoint), SeRQL • Podpora RDF, RDFS odvodzovania, možno načítať aj OWL • OWLim[www.ontotext.com/owlim/index.html], v Jave • Plugin do Sesame 1.2.x, 2.x • Podpora OWL a ľahkého odvodzovania nad OWL • Jena [jena.sourceforge.net], opensource v Jave • Dostupné cez Java API a ako SPARQL endpoint • Podpora RDF, RDFS, OWL, pravidlového odvodzovania • Tuším podporuje aj zapojenie odvodzovačov tretích strán
Ontológia vs. relačná DB „Ťažká“ či „ľahká“ sémantika? To je otázka... Ontológie umožňujú jednotnú prácu s dátami aj metadátami (štruktúrou) Ontológie sú (mali by byť) „samoopisné“ „Natívna“ podpora odvodzovania Iné dopytovacie jazyky (SPARQL vs. SQL) Horšia škálovateľnosť ontologických úložísk
Knižnice a ďalšie nástroje „Ťažká“ či „ľahká“ sémantika? To je otázka... • SemWeb knižnica [razor.occams.info/code/semweb] • .NET/C# na prístup/dopytovanie cez SPARQL endpoint • DotSesame knižnica [sourceforge.net/projects/dotsesame] • .NET/C# port knižnice Sesame (cez IKVM) • Semantic Web ClientLibrary[www4.wiwiss.fu-berlin.de/bizer/ng4j/semwebclient] • Java knižnica nad Jenou pre prístup k LinkedData • OWL API [owlapi.sourceforge.net] • Java knižnica na RDF/RDFS a OWL, prepojenie na odvodzovačePellet/FaCT++ • Odvodzovače • Pellet, FaCT++, RacerPro, OWLim
Takto vyzerá Protégé... „Ťažká“ či „ľahká“ sémantika? To je otázka...
Takto vyzerá Protégé... „Ťažká“ či „ľahká“ sémantika? To je otázka...
Možnosti použitia ontológií „Ťažká“ či „ľahká“ sémantika? To je otázka... Zdieľanie dát, prepojené dáta (LinkedData) Automatizované spracovanie a odvodzovanie Vyhľadávanie so sémantikou Prieskumné vyhľadávanie
Personalizácia prehliadania „Ťažká“ či „ľahká“ sémantika? To je otázka...
Sledovanie histórie „Ťažká“ či „ľahká“ sémantika? To je otázka...
Kolaboratívna tvorba obsahu „Ťažká“ či „ľahká“ sémantika? To je otázka...
Inkrementálne prehliadanie grafom „Ťažká“ či „ľahká“ sémantika? To je otázka...
Odkazy RDF: http://www.w3.org/TR/rdf-primer/ RDFS: http://www.w3.org/TR/rdf-schema/ OWL: http://www.w3.org/TR/2004/REC-owl-ref-20040210 OWL2: http://www.w3.org/TR/owl2-profiles/ Protégé: http://protege.stanford.edu http://owl.cs.manchester.ac.uk/tutorials/protegeowltutorial/ „Ťažká“ či „ľahká“ sémantika? To je otázka...