330 likes | 610 Views
Lightweight vs Heavyweight (Neformálna vs Formálna). Marián Šimko vs Michal Holub. 9. 10. 2012. PeWe. koncept (pojem, designát). designácia. sinifikácia. objekt (vec, denotát). pes. denotácia. symbol (slovo, designátor). (Frege, 1982; Sowa; 2000). Sémantika. údaje s významom
E N D
Lightweight vs Heavyweight(Neformálna vs Formálna) Marián Šimko vs Michal Holub 9. 10. 2012 PeWe
koncept (pojem, designát) designácia sinifikácia objekt (vec, denotát) pes denotácia symbol (slovo, designátor) (Frege, 1982; Sowa; 2000)
Sémantika • údaje s významom • light vs heavy (neformálna vs formálna) • rozdiel je v „množstve“ významu • potrebná pre stojové spracovanie údajov
Príklad ontologickej reprezentácie GE číslo prírodná GE obývaná GE krajina kopec rieka mesto hlavné mesto Kráľova hoľa Ipeľ Slovensko 1946 232 Bratislava Poltár
Heavyweight ontológia • four disjoint sets C, R, A and T whose elements are called concept identifiers, relation identifiers, attribute identifiers and data types, respectively, • a semi-upper lattice ≤c on C with top element rootc, called concept hierarchy or taxonomy, • function σR: R → C+ called relation signature, • a partial order ≤R on R, called relation hierarchy, where r1≤R r2 implies|σR(r1)| = |σR(r2)| and пi(σR(r1)) ≤c пj(σR(r2)), for each 1 ≤ i ≤ |σR(r1)|, and • a function σA: A → C x T, called attribute signature, • a set T of datatypes such as strings, integers, etc. (Cimiano, 2006)
Heavyweight ontológia • Definition 2 (Domain and Range) • Definition 3 (ℒ-axiom System) • Definition 4 (Lexicon) • Definition 5 (Knowledge Base (KB)) • Definition 6 (Instance Lexicon) • Definition 7 (Extension) • Definition 8 (Intension) (Cimiano, 2006)
Heavyweight ontológia General Axioms ∀x(country(x) → ∃y capital_of(y,x) ∧ ∀z(capital_of(z,x) → y=z)) Axiom Schemata disjoint(river, mountain) Relation Hierarchy capital_of ≤R located_in Relations flow_through(dom:river, range:GE) Concept Hierarchy capital ≤C city, city ≤C GE Concepts c:= country := <i(c), ||c||, RefC(c)> Synonyms {country, nation} Terms river, coutry, nation, city, capital,... (Cimiano, 2006)
Koncept – trojica • ( i(c), [c], RefC(c) ) • i(c) – intenzionálny opis • [c] – extenzionálny opis • RefC(c) – lexikálna realizácia v korpuse
Štandardy – RDF(S) RDF Schema osoba podtrieda obor hodnôt def. obor predmet učiteľ učí typ typ učí http://fiit.sk/~holub http://osa.fiit.stuba.sk/os RDF dáta
RDF(S) príklad <?xmlversion="1.0"><rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:dbpp="http://dbpedia.org/property"xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"><rdf:Descriptionrdf:about="http://dbpedia.org/resource/Leipzig"><property:hasMayorrdf:resource="http://dbpedia.org/resource/Burkhard_Jung"/><rdfs:labelxml:lang="de">Leipzig</rdfs:label><geo:latrdf:datatype="float">51.3333</geo:lat><geo:lonrdf:datatype="float">12.3833</geo:lon></rdf:Description></rdf:RDF>
RDF(S) – problémy doména a rozsah sa nedajú obmedziť hasChild pri osobe je osoba, pri pande panda nedá sa obmedziť existenia a kardinalita každá osoba má práve jednu matku typu osoba nedajú sa definovať tranzitívne, inverzné, symetrické tvrdenia príliš nepodporuje odvodzovanie, dokazovanie
Štandardy – OWL OWL Light(pod)triedy, indivíduá(pod)vlastnosti, doména, rozsahkonjunkcia(ne)rovnosťcardinalita 0/1dátové typyinverzia, tranzitivita, symetria OWL DL OWL fullnegácia, disjunkcia meta triedyplná kardinalitavymenované typy RDF Schema
Lightweight ontológia Termy jedno a viac-slovné výrazy pizza Slovníky Termy s výkladom, vysvetlením pizza - A baked Italian dish of a thinly rolledbreaddoughcrusttypically topped before baking with tomato sauce, cheese and other ingredients such as meat, vegetables or fruit
Lightweight ontológia Taxonómie Hierarchické vzťahy typu is-a food, pizza, margherita Tezaury Slovníky, navyše s: Hierarchickými vzťahmi: všeobecnosť (hypero-/hyponymá), časť celku (mero-/holonymá) Vzťahmi ekvivalencie Vzťahmi paradigmatickej podobnosti (relatedness)
Kritériá expresivita konzistentnosť zostrojiteľnosť rýchlosť transparentnosť inštanciovateľnosť interoperabilita
Expresivita Heavyweight jazykovo nezávislá trojaká definícia konceptu „plnohodnotné“ usudzovanie, odvodzovanie • Lightweight • jazykovo závislejšia • lexikálny základ • koncept – term • „primitívne“ usudzovanie • na základe podobnosti • porovnanie definícií (reťazce) • grafové algoritmy
Heavyweight daná modelom overiteľná Lightweight latentná daná metódami, ktoré pracujú s modelom Konzistentnosť
Zostrojiteľnosť General Axioms ∀x(country(x) → ∃y capital_of(y,x) ∧ ∀z(capital_of(z,x) → y=z)) Axiom Schemata disjoint(river, mountain) Relation Hierarchy capital_of ≤R located_in Relations flow_through(dom:river, range:GE) Concept Hierarchy capital ≤C city, city ≤C GE Concepts c:= country := <i(c), ||c||, RefC(c)> Synonyms {country, nation} Terms river, coutry, nation, city, capital,... (Cimiano, 2006)
Zostrojiteľnosť General Axioms ∀x(country(x) → ∃y capital_of(y,x) ∧ ∀z(capital_of(z,x) → y=z)) 0 % Axiom Schemata disjoint(river, mountain) H Relation Hierarchy capital_of ≤R located_in 10 – 20% Relations flow_through(dom:river, range:GE) Concept Hierarchy capital ≤C city, city ≤C GE 40 – 50% L Concepts c:= country := <i(c), ||c||, RefC(c)> 70 – 80% Synonyms {country, nation} Terms river, coutry, nation, city, capital,... (Cimiano, 2006)
Heavyweight v závislosti od veľkosti ontológie pomerne pomalá Lightweight rýchla Rýchlosť
Heavyweight vyššia Lightweight nižšia Transparentnosť • miera čitateľnosti / porozumiteľnosti človekom
Heavyweight nižšia Lightweight vyššia Inštanciovateľnosť (angl. population)
expresivita konzistentnosť zostrojiteľnosť rýchlosť (použitia) transparentnosť inštanciovateľnosť interoperabilita -- + -- + + -- + -- -- + + -- -- + Kritériá lightweight heavyweight
Prípadové štúdie ALEF TraDiCe YAGO-NAGA Farmafirma
ALEF • Adaptívny výučbový systém • Modelovanie vedomostí študenta: • koncept-vedomosť • využitie pre prispôsobenie systému • odporúčanie • navigácia • Teória šírenia vedomostí • Žiadne pokročilé usudzovanie
ALEF Vzdelávacie objekty Koncepty Vzťahy medzikonceptmi (E , R , F , A , T , t) lo2 lo5 lo1 lo4 ... lon lo3
TraDiCe články, autori, publikácie, konferencie reprezentácia pomocou RDF skúmame vzťahy medzi entitami vyhľadávanie, navigácia
YAGO-NAGA Yet Another Great Ontology sémantická báza znalostí automaticky zostavená z Wikipédie, GeoNames NAGA sémantický vyhľadávač „ktorý fyzik sa narodil v ten istý rok ako Einstein“?
Farmaceutická firma • Ontológia liečiv (referenčná) • Ontológia chorôb • Národná databáza pacientov • Prípad: vývoj vlastných liečiv, prepojenie s národným systémom • Doménová znalostná reprezentácia – heavy
Zhodnotenie • Víťaz duelu • Nejednoznačný • Voľba reprezentácie • V závislosti od cieľa web. / informačného systému
Literatúra Cimiano, P.: Ontology Learning and Population from Text: Algorithms, Evaluation and Applications. Springer, ISBN 0-387-30632-3 (2006) Frege, G.: Über Sinn und Bedeutung. Zeitschrift für Philosophic und philosophische Kritik, 100, pp. 25–50 (1892) Hoffart, J., Suchanek, F., Berberich, K., Weikum, G.: YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia. Special issue of the Artificial Intelligence Journal (2012) Wong, W., Liu, W., Bennamoun, M.: Ontology learning from text: A look back and in the future. ACM Computing Surveys (CSUR), 44(4), Article No. 20 (2012)
Literatúra Ontologies: introduction, design, languages and tools. <http://www.slideshare.net/fulvio.corno/ontologies-introduction-design-languages-and-tools> RDF: http://www.w3.org/TR/rdf-primer/ RDFS: http://www.w3.org/TR/rdf-schema/ OWL: http://www.w3.org/TR/2004/REC-owl-ref-20040210