190 likes | 611 Views
Department of Instrumentation and Control Engineering, Faculty of Mechanical Engineering, CTU in Prague, Technická 4, 166 07 Prague 6. Sémantický web a ontologie. Jakub JURA Jakub.Jura @fs.cvut.cz. Projektování informačních systémů. Informace. informatio = představa, obrys .
E N D
Department of Instrumentation and Control Engineering, Faculty of Mechanical Engineering, CTU in Prague, Technická 4, 166 07 Prague 6 Sémantický web a ontologie Jakub JURA Jakub.Jura@fs.cvut.cz Projektování informačních systémů
Informace • informatio = představa, obrys. • informare = In + formare • formare znamená utvářet, formovat (veřejné) mínění • formare je od latinského základu FORM = tvar, vnějšek, které vzniklo přesmykem z řeckého MORFÉ
Ogden-Richardsův trojúhelník Význam Designát míní Označuje Psychika Zastupuje Jazyk Realita Znak Vehikulum Objekt Denotát
Sémantický WEBweb druhé generace • Síť pro sdílení vědeckých výsledků • Web jako velmi složitá sémantická síť • Kyberprostor jako datová džungle • Dolování dat z webu, page rank, autority a rozcestníky • Zipf's Law(výskyt prvního neobvyklejšího slova je x1, druhého je cca x1/2, třetího je x1/3 atd.) • Bradford's Law(300 citations, according to Bradford Law of Scattering you'd discover that 100 of those citations came from a core group of 5 journals, another 100 citations came from a group of 25 less-core journals, and the final 100 citations came from 125 peripheral journals.)
Dolování dat z webu • Web musí být srozumitelný nejen lidem, ale i webovým agentům (Tim Berners-Lee). • Jak zajistit, aby agent hledal to co chceme? • Aby při hledání „ceny čokolády“ nehledal různá ocenění? • Aby pracoval s požadovaným významem výrazu?
http://www.w3.org/ Konsorcium w3cmetadata a ontologie • HTML • SGML (ISO 8879) • XML (Extensible Markup Language), DTD • Umožňuje popsat hierarchickou strukturu webového dokumentu • RDF (Resource Description Framework) • Strukturovaný popis metadat - sémantika • OWL (Web Ontology Language) • Řeší např. problematiku různého významu téhož výrazu
Vize • Sémantiazce webu – jeho sémantický popis, aby vyhledávače měly více informací. • Popis jednotlivých výrazů (řetězců) a použití adekvátní ontologie, pro žádoucí zpracování těchto výrazů. • Automatizovaná údržba a rozvoj stávajících ontologií.
Jazyky pro semWEB • HTML – nezachytí sémantiku. • <p><i>cena</i>cokolady</p> • XML – možnost nadefinovat významuplné tagy. • <vyrobek> <nazev>cokolada</nazev><cena>cena</cena></vyrobek> • RDF (Resource Description Framework) • Má strukturu: subjekt – predikát (sloveso) – objekt. Jinými slovy: znalostní prvek A má pro vlastnost B hodnotu C. Např.: A = Čokoláda, B = cena, C = 20 Kč. • Ontologie • Sémantika se přidá tak, že se znalostním prvkům přiřadí obecné třídy, které jsou (i se svými vlastnostmi) definované v ontologiích. • OWL (Web Ontology Language) • Řeší např. problematiku různého významu téhož výrazu
Příklad RDF/XML The students in course 6.001 are Amy, Tim, John, Mary, and Sue. is written in RDF/XML as <rdf:RDF> <rdf:Description about="http://mycollege.edu/courses/6.001"> <s:students> <rdf:Bag> <rdf:li resource="http://mycollege.edu/students/Amy"/> <rdf:li resource="http://mycollege.edu/students/Tim"/> <rdf:li resource="http://mycollege.edu/students/John"/> <rdf:li resource="http://mycollege.edu/students/Mary"/> <rdf:li resource="http://mycollege.edu/students/Sue"/> </rdf:Bag> </s:students> </rdf:Description> </rdf:RDF>
Ontologie • Ontologie je explicitní specifikacekonceptualizace (Gruber 1993). • Specification of a conceptualization(T. Gruber 1993) • Ontologie je explicitní specifikace sdílené konceptualizace. • Formal specification of sharedconceptualization (W. N. Borst 1997) • Ontologie je systém kategorií (nejobecnějších pojmů), které jsou klíčové pro dané vidění světa. • System of categories accounting for a particular vision of the world (N.Guarino1998). Konceptualizace je vyvoření systému pojmů nebo konstruktů, pomocí kterých můžeme modelovat vybranou část světa. Conceptualization is system of the constructs which models specific part of the world.
Původ slova ve filosofii Ontologie jest nauka o jsoucnu jakožto absolutním kladu a proto tolik jako metafysika. Ontologismus sluje filosofický systém Giobertiho (v. t.). Ontologický důkaz o jsoucnosti boží spočívá na domněnce, že představa nejdokonalejší bytosti obsahuje v sobě též existenci jako znak. Viz čl. Esse (Ottův slovník http://encyklopedie.seznam.cz/heslo/309363-ontologie
Ontologie • Původně termín z filosofie • Složené z řeckých slov • On = jsoucno, tedy něco co jest. • Logos = nauka, věda, výklad, slovo … - racionální uchopení. • Aristoteles – metafyzika – nauka o všem co jest a co k tomu náleží • Oddělení metafyziky generalis od specialis • Nauka o jsoucnu jako jsoucnu
Rysy jsoucna • Akce a potence • Esence a existence • Kategorie – nejvyšší rody jsoucna • Jednota – mnohost • Příčina – účinek • Látka – tvar • Část – celek • Prostředek – cíl
Pojetí ontologie ve filosofii a AI • Mnoho nešvarů vytýkaných filosofickým ontologiím mají i ontologie používané v AI – např. záměna ontologie s gnoseologií, problém s metajazykem atd. • Ontologie deskriptivní a deduktivní (i v AI jsou ontologie, které jsou popisné a jiné mají také inferenční mechanismy)
Rozdělení ontologií • Podle předmětu formalizace • Doménové, • Úlohové, • Aplikační a • Generické.
Rozdělení ontologií • Podle historického vývoje • Terminologické, • Informační a • Znalostní
MBO – Upper level ontologie pro molekulární biologii - http://www.bioinfo.de/isb/2002/02/0017/main.html#img-3
Jazyky pro reprezentaci ontologií • Bylanderovy konsolidace(graficko symbolický jazyk) • ONTOLINGUA • Jazyk CycL je jazykem projektu Cychttp://www.opencyc.org/ • OCML (Ontology Compositional Modelling Language) • DAML-ONT (Darpa Agent Mark-Up Language-ONTology), • Mezi další jazyky pro reprezentaci ontologií patří • OIL (Ontology Inference Layer) • DAML+OIL