910 likes | 1.23k Views
Ontologické inženýrství. Vojtěch Svátek, Miroslav Vacura Fakulta informatiky a statistiky VŠE v Praze. Témata tutoriálu (část I). Úvod Vymezení pojmu ontologického inženýrství „Nová“ historie OI, souvislost se sémantickým webem Filosofické aspekty OI Návaznost na filosofickou ontologii
E N D
Ontologické inženýrství Vojtěch Svátek, Miroslav Vacura Fakulta informatiky a statistiky VŠE v Praze
Témata tutoriálu (část I) • Úvod • Vymezení pojmu ontologického inženýrství • „Nová“ historie OI, souvislost se sémantickým webem • Filosofické aspekty OI • Návaznost na filosofickou ontologii • Základní vs. doménové ontologie • Tvorba obsahu doménových ontologií • Životní cyklus a metodiky • Využití základních ontologií • Obsahové návrhové vzory • Práce s textovými podkladovými zdroji
Témata tutoriálu (část II) • Logické pozadí ontologického inženýrství • OWL-DL: struktura jazyka • Odvozování v deskripční logice • Logické „paradoxy“ OWL-DL • Strukturně-logické vzory a konvence • Aplikace ontologií • Stručný přehled • Demo: anotování multimédií pomocí ontologie • Interaktivní procvičení tvorby ontologie • Návrh ontologie „pořádání konference“ vycházející ze zkušeností s Datakonem
Základní vymezení a historie ontologického inženýrství
Ontologické inženýrství • Soubor aktivit souvisejících s procesem vývoje ontologií, jejich životním cyklem, a s metodikami, nástroji a jazyky pro tvorbu ontologiíGomez-Perez, A., Fernandez-Lopez, M., Corcho, O.: Ontological Engineering: with Examples from the Areas of Knowledge Management, E-Commerce and the Semantic Web. Springer, 2003.
Co je ontologie? • Vědecká disciplína - součást filosofie • bude stručně rozebráno později • Lidský artefakt používaný v oblasti informatiky; neexistuje jednotná definice • Strukturovaná slovní zásoba • Explicitní specifikace konceptualizace • Logická teorie • v jazyce podporujícím „definování konceptů“, zejména. deskripční logice • Grafová struktura nad pojmy
Časté atributy („pravé“) ontologie • Odpovídající realitě • Konsensuální, obecně přijímaná • Srozumitelná člověku, dále sdílitelná • Znovupoužitelná, a to i nepředjímaným způsobem • Bohatě strukturovaná • Formální, strojově zpracovatelná • Logicky konzistentní
Historické trendy (I) • Polovina 90. let: etablování ontologií jako prostředku reprezentace znalostí v UI • syntaxe Lisp • sémantika predikátového kalkulu + rámcový model • Ontolingua, OKBC, OCML • souběžně jiné modely, zejména konceptuální grafy • Konec 90. let: nástup XML a webu • nativní XML: XOL, OML;v současnosti zejména Topic Maps • webově orientované jazyky: SHOE, Ontobroker
Historické trendy (II) • Cca od r. 2000: v kontextu sémantického webu • spojení s RDF, podpora W3C • DAML-ONT, OIL, DAML+OIL, OWL • posun k pojetí většího počtu ontologií, které je třeba pružně kombinovat a vzájemně mapovat • formálním základem deskripční logika (+ zbytky rámcového přístupu) • pragmatické kombinování s pravidlovým přístupem • Současnost: mj. snaha o spojení s Web 2.0 • ontologická podpora nad wiki, blogy, folksonomiemi…
Prorůstání do původně vzdálených komunit • softwarové inženýrství • UML metamodel pro definici ontologií (OMG) • řada aplikací nad úložišti SW komponent • SOA • sémantika ve webových službách (WSMO) • databáze • RDF podporován některými DBMS (Oracle) • soft computing • rozšíření ontologických jazyků o neurčitost/vágnost (např. FuzzyOWL, BayesOWL…)
Výuka ontologického inženýrství • Tradičně jako spíše okrajová oblast UI • Nově v kontextu sémantického webu • Specializované kurzy méně běžné, ale existuji i v komerční sféře • Wilshire: 4 dny za cca $2000 • Na VŠE Praha od r. 2000 • součást kurzů „Modelování znalostí“ a později „Reprezentace a zpracování znalostí na WWW“ • od r. 2008 hlavní část nového kurzu „Znalosti a ontologické inženýrství“ v rámci rovněž nového programu „Kognitivní informatika“
Historie ontologie • Parmenidés • Platón • Aristotelés • Spisy Metafyzika a Kategorie • Ve filosofii: metafyzika, ontologie, „první filosofie“.
Vznik tradiční ontologie Aristotelés – 10 kategorií Substance Kvantita Kvalita Vztah Místo Čas Poloha Mít Činnost Trpnost
Vznik tradiční ontologie Aristotelská definice „definice“ Definitio per genus proximum et differentia specifica Genus proximum = nejbližší rod Differentia specifica = specifická (druhová) diference
Viper = venomous Old World snakes characterized by hollow venom-conducting fangs in the upper jaw Genus proximum Differentia specifica (Wordnet)
Genus proximum Snake = limbless scaly elongate reptile Differentia specifica (Wordnet)
Reptile Snake Viper
Reptile Snake Lizard Turtle Viper Anaconda Cobra
Taxonomie Hierarchická struktura Tradice: Klasické ontologie Thesaury Dnes: ISA hierarchy (Book is a document) Ontologie Lexicon (HPSG – head-driven phrase structure, ILEX, DATR)
Porfyriův strom ARBOR PORPHYRII První klasická ontologie Porfyrios z Tyru (232-301) Aristotelská tradice
Substance Porfyriův strom materiální imateriální Těleso oduševnělé bez duše Organismus vnímavé nevnímavé Živočich rozumný nerozumný Člověk Sokrates
Témata tradiční ontologie Esenciální / neesenciální vlastnosti Problém změny (kdy je změna entity taková, že je nutno ji reklasifikovat) Problém identity (kdy různé „identifikátory“ odkazují k téže entitě) Leibnizův zákon identity Problém obecnin
Vlastnosti Esenciální Neesenciální (akcidentální) Esence - bytnost, „cost“, quidditas (quid lat. co) To, co dělá danou věc, tím čím je. (Například člověka člověkem, strom stromem atd.) Jednotliví lidé se navzájem liší neesenciálními vlastnostmi (věk, pohlaví, výška, váha, barva…)
Problém změny Změna esenciální – daná věc se změní v něco jiného, nutno reklasifikovat v rámci ontologie. Změna akcidentální – daná věc zůstává tím čím byla, mění se jen neesenciální vlastnost.
Leibniz Zákon stejnosti identických Zákon identity stejných
Ontologický závazek které entity jsme povinni zařadit do naší ontologie „Být znamená být hodnotou (vázané) proměnné“ (Quine) Kritérium identity Pro „materiální“ entity Pro abstraktní entity (Frege) Obecné kriterium identity R pro entity typu F
Tvorba ontologií • shora dolů („top-down“) • základní ontologie • zdola nahoru („bottom-up“) • „od středu ven“ („middle-out“), • doménové ontologie
Klasifikace ontologií • Operacionalizace • hrubé (coarse) • jemné (fine-grained) • Expresivita • těžké (heavy-weight) • lehké (light-weight)
Klasifikace ontologií • Specifičnost • obecná (generic) • jádrová (core) • doménová (domain) • Základní ontologie(Foundational, Upper-level)
Základní ontologie Poskytují referenci pro srovnávání různých ontologických přístupů, a rámec pro analýzu, harmonizaci a integraci ontologií a metadatových standardů. Poskytují výchozí bod pro tvorbu nových ontologií. Základní ontologie obsahují předdefinovanou skupinu ontologických entit, které mohou být znovu využity.
Základní ontologie V ideálním případě také základní ontologie definuje návrhové vzory pro běžně se vyskytující případy modelování. Pomáhají uživateli vypořádat se s typickými problémy, na které může při návrhu ontologií narazit.
Klasifikace ontologii Problém abstraktních a konkrétních entit Problém obecnin a jednotlivin Přistup k jazyku a skutečnosti descriptive vs. revisionary Rozsah ontologie multiplicative vs. reductionist Reprezentace času presentism vs. eternalism Reprezentace modalit actualism vs. possibilism Problém modelování změn
Upper level ontologie - příklady KR Ontology (J.F.Sowa) SUMO DOLCE Wordnet.OWL (http://taurus.unine.ch/knowler/) CYC (www.cyc.com) …
KR Ontology J.F.Sowa: Knowledge Representation Influence: Ch. S. Peirce A. N. Whitehead (http://www.jfsowa.com/ontology/)
KR Ontology – Základní kategorie Relace Independent - I Relative - R Mediating – M Podstata Physical - P Abstract - A Čas Continuant - C Occurent - O Kategorie primitivní termíny, nedefinovatelné v rámci dané ontologie.
KR Ontology Independent „An entity characterized by some inherent Firstness, independent of any relationships it may have to other entities.“ Relative „An entity in a relationship to some other entity.“ Mediating „An entity characterized by some Thirdness that brings other entities into a relationship. An independent entity need not have any relationship to anything else, a relative entity must have some relationship to something else, and a mediating entity creates a relationship between two other entities.“
KR Ontology Independent (x:Independent) ~(y)(has(x,y) v has(y,x)). Relative (x:Relative) (y)(has(x,y) v has(y,x)). Mediating (m:Mediating)(x,y:Entity) ((R,S:Relation)(R(m,x) &S(m,y))) &(T:Relation)T(x,y).
KR Ontology Endurant (continuant) – entity „celé“ přítomny v každém okamžiku své existence. Pendurant (occurent) – entity u nichž v každém okamžiku existuje jen temporální část.
KR Ontology Endurant „kniha“ „osoba“ Pendurant „četba této knihy” „život člověka“
SUMO Suggested Upper Merged Ontology (http://ontology.teknowledge.com/) Formáty KIF, OWL, Protege, LOOM, Některé koncepty mohou mít více nadkonceptů, e.g. PsychologicalDysfunction is a child of both PsychologicalAttribute and DiseaseOrSyndrome.
SUMO Entity Abstract Physical SetOrClass Process Object Relation Internal Change SelfConnected Object Number Quantity Physical Quantity Intentional Change Region Atribute Collection Proposition DualObject Process Agent ShapeChange Motion
SUMO Entity Abstract Physical SetOrClass Process Object Relation Internal Change SelfConnected Object Number Quantity Physical Quantity Intentional Change Region Atribute Collection Proposition DualObject Process Agent ShapeChange Motion
„Set can be an arbitrary set of things“ „Collection consists of disconnected parts, and the relation between these parts and the whole is known as member in the SUMO.“ SUMO