330 likes | 520 Views
Ontologien - Eine Einführung Formale Ontologie & Semantic Web. Vorlesung „Wissensrepräsentation“ Prof. G. Brewka. Frank Loebe frank.loebe@informatik.uni-leipzig.de Abt. Intelligente Systeme Institut für Informatik Universität Leipzig. Übersicht. Historische Motivation Begriffsbestimmung
E N D
Ontologien - Eine EinführungFormale Ontologie & Semantic Web Vorlesung „Wissensrepräsentation“Prof. G. Brewka Frank Loebe frank.loebe@informatik.uni-leipzig.de Abt. Intelligente Systeme Institut für InformatikUniversität Leipzig
Übersicht • Historische Motivation • Begriffsbestimmung • Anwendungen • Einteilungen • Top-level Ontologien • Ontologie im / undSemantic Web • Forschungsbereiche Box: neues Thema Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie: intuitiv • ähnlich konzeptueller Modellierung bei Software-Entwicklung • gegeben: eine Domäne oder Aufgabe • Frage: Worüber (= über welche Entitäten / Dinge / ...) ist dabei zu sprechen? • Bsp: Domäne Uni-Sommerkurs • Personen, Studenten, Lesende, Professoren, Tafeln, ... • Kurse, Vorlesungen, Übungen, Vorlesungsbesuche, ... • Termine, Hörsäle, ... • Themen, Probleme, Theoreme, ... Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Historische Motivation:Wiederverwendbarkeit von Wissensbasen • 1980er: diverse WBS, Austausch nur durch Rekodierung • Probleme: • verschiedene Repräsentations-sprachen & Dialekte • fehlende Kommunikations-standards(für Austausch zw. WBS) • unterschiedliche Terminologie / Konzeptualisierung / Ontologie • im Ergebnis: Interesse an • Standardsprachen • Ontologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme [Neches et al., 1991]
Semantic Web • ca. 2000-2001: Vision des Semantic Web • Hauptziel:Anreicherung der Informationen im Internet,um diese besser automatisiert verarbeiten zu können • Bsp.: Einkauf im Web über Agenten • Ontologie(n) alsSchlüsseltechnologie • derzeit: Web 2.0 • Ergänzung oderGegenspieler desSemantic Web ? [W3C, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung • Drei Leseweisen für „Ontologie“ 1.) philosophisch: • Fach Ontologie 2.) informatisch / in KI: • Ontologie als Begriffssystem 3.) Spezialfall von 2.): Ontologie im Semantic Web: • Ontologie als Technologie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung:Ontologie (I) • Philosophie:Fach „Ontologie“ (Ontology) • etymologisch: aus dem Griechischen • „ontos“ – Sein • „logos“ – Lehre, Wort • Lehre vom Sein / Seienden • Systeme grundlegender Kategorien • oft reduktionistisch • Definitionen: • „As a first approximation, ontology is the study of what there is.“ [Hofweber, 2004, SEP] • „Theorie kategorialer Folgerungen“ [Seibt, 2004] • „... the systematic, formal, axiomatic development of the logic of all forms and modes of being.” [Cocchiarella, 1991] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Beispiel: Kategorien- system Substance material immaterial Body Spirit animate inanimate Living Mineral sensitive insensitive Animal Plant rational irrational Human Beast [Sowa, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Begriffsbestimmung: Ontologie (II) • „eine Ontologie“ in der Informatik (ontology) • Spezifikation / Theorie von Begriffen und deren Zusammenhängen • Zweck: gemeinsames / geteiltes Verständnis • Definitionen • „... an explicit specification of a conceptualization.“ [Gruber, 1993] • „... an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.“ [Gruber, 2008] • „An ontology is a logicaltheory accounting for theintended meaning of aformal vocabulary, i.e., itsontological commitment to aparticular conceptualizationof the world.“ [Guarino, 1998] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Tutorialbeispiel:Pizza-Ontologie(in Protege) [http://www.co-ode.org/resources/tutorials/protege-owl-tutorial.php] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Abgrenzungen • Ontologien vs. Wissensbasen • ontologisch: • Wenn X ein Objekt ist, kann X kein Prozess sein. • dagegen nicht: • John ist 80 kg schwer. • Um das Essen auszuwählen, wird zuerst die Karte studiert. • Ontologische/Terminologische Fakten [Brachman, Levesque, 2004] • Unterkategorien / Spezialisierung Student is-a Person • Disjunktheit Student und Vorlesung • Überdeckung (Exhaustiveness) Mann, Frau für Person • Typrestriktionen für Relationen nur Personen lehren • inverse Relationen • versch. Relationseigenschaften, z.B. Transitivität, Symmetrie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Übersicht • Historische Motivation • Begriffsbestimmung • Anwendungen • Einteilungen • Top-level Ontologien • Ontologie im / undSemantic Web • Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Anwendungen (I) • Medizin & Biologie: Terminologien & Ontologien • ICD: K09.0 • K00-K93 Krankheiten des Verdauungssytems • K00-K14 Krankheiten der Mundhöhle, der Speicheldrüsen und der Kiefer • K09.- Zysten der Mundregion, anderenorts nicht klassifiziert • K09.0 Entwicklungsbedingte odontogene Zysten (u.a. Keratozyste) • SNOMED, GALEN, FMA, UMLS ... • OBO: Open Biomedical Ontologies • Gene Ontology, Mouse Anatomy, Celltype Ontology, ... Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Entity Physical Object Organism Plant Alga Fungus Virus ... Substance ... Conceptual Entity Idea or Concept ... Finding Language ... Event Activity Behavior Social Behavior ... Machine Activity Phenomenon / Process Human caused P/P Natural P/P Biologic Funct. Pathologic F. ... Injury or Poisoning Bsp.: UMLS (Auszug) Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Anwendungen (II) • Anwendungszwecke • korrekte Wiederverwendung von Informationen & Softwarekompon. • Fehlererkennung / -vermeidung • Vereinfachung von Datenintegration und Interoperabilität • „semantische“ Verarbeitung, z.B. semantische Suche • Grundlage/Ergänzung für Methoden der Domänenmodellierung • Anwendungsgebiete • Knowledge Engineering & Representation • *-Integration (Datenintegration, Unternehmensintegration, ...) • Wissensmanagement • Konzeptuelle Modellierung, Datenbankentwurf • Sprachverarbeitung Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Einteilung von Ontologien • Ontologie: • Spezifikation / Theorie von Begriffen und deren Zusammenhängen • historisch gewachsen im KI-Bereich • Aufgaben-Ontologie + Domänenontologie = Anwendungsontologie • „Spezifikation“ nach Formalisierungsgrad • „Begriffe“ nach Allgemeinheitsgrad nach Domäne (Bio-, Medizin-, Business-, ... Ontologien) • außerdem:linguistische Ontologien z.B. Wordnet Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Arten: nach Formalisierung informal • informal • Begriffsliste, (kontrolliertes) Vokabular, Katalog, Glossar • ggf. auch: Text • Begriffshierarchie • Taxonomie, Nomenklaturen • z.B. ICD, UNSPSC, ... • semiformal • Thesaurus, semantisches Netz, UML- oder ER-Diagramme • z.B. FMA, MeSH, WordNet, ... • formal • formalisierte logische Theorie, z.B. in FOL, DL • z.B. SNOMED, GALEN formal Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Arten: nach Allgemeinheit • Top-level-Ontologie • Kategorien für die meisten Anwendungsbereiche • Bsp.: Objekt – Prozess – Qualität • Kern-Ontologie (Top-Domänen-Ontologien) • Kategorien für einen größeren Anwendungsbereich • Bsp.: Mensch – Krankheit – Größe • Domänen-Ontologie • Kategorien für einen spezifischen Anwendungsbereich • Bsp.: Leukozyt – chronisch lymphatische Leukämie Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Top-level Ontologie(n) • Ziel: Charakterisierung von Begriffen, auf die die meisten Domänen zurückgreifen allgemeinste Begriffe • Themen: • Individuen und Kategorien – Raum, Zeit • Objekte, Prozesse – Situationen, Fakten • Eigenschaften, Relationen • Mereologie (Teil-Ganzes Beziehung) • Kausalität • Rollen, Funktionen – Löcher – Granularität • Repräsentation, Symbole, Information ... • Systeme: BFO, (tlw. CYC), DOLCE, GFO, SUMO, ... • Abgrenzung • allgemeinste Begriffe, keine Commonsense-Wissensbasis (z.B. CYC) • linguistische Ontologien: WordNet Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
General Formal Ontology (GFO) • Darstellungen • informal: • Report “General Formal Ontology (GFO): A Foundational Ontology Integrating Objects and Processes“ (v 1.0.1: 2007) • weitere Publikationen • formal: tlw. Axiomatisierungen • in FOL: ca. 300 Formeln (Axiome, Definitionen, Folgerungen) • in OWL: 77 Klassen, 67 Relationen http://www.onto-med.de/ontologies/gfo.owl • Status • begonnen ca. 1999 • ständige Erweiterung & Weiterentwicklung • erste Anwendungen neue Anforderungen Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Kategorien und Klassen Raum und Zeit Qualitäten und Relationen Entitäten Individuen* Objekte und Situationen Prozesse ... General Formal Ontology (GFO) Grundeinteilungen Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
GFO Kategorien-Hierarchie (2006) entity category concrete entity immanent universal conceptual structure symbolic structure individual quality relator (relational) role persistant property relation formal relator material relator space-time entity presential material structure spatial entity time entity material boundary occurrent configur- ation time region time boundary space region spatial boundary material object process change situation situoid chronoid topoid Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
GFO Grundrelationen (2006) formal relator boundary projection element-of instantiation at projection association location framing ontical connectedness occupation chron top participation boundary-of fills- role role-of relativized part-of abstract part-of right boundary left boundary has-quality value-of constituent part-of inherence coincidence spatial part-of congruence extension space temporal part-of Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Übersicht • Historische Motivation • Begriffsbestimmung • Anwendungen • Einteilungen • Top-level Ontologien • Ontologie im / undSemantic Web • Forschungsbereiche Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie im / und Semantic Web • Prinzipien für das Semantic Web • Identifizierbarkeit über URIs • Semantische Typisierung von URIs • Partielle Informationen Open World Assumption • keine globale Konsistenz erwartet / angestrebt • Ontologie: • RDF:Ontologien als Graphen • Web Ontology LanguageOWL:Ontologien alsBeschreibungslogik-Theorien [W3C, 2000] Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
OWL Ontologien (technologisch) • OWL • Standard seit 2004 (OWL 1.0) • OWL 1.1 bereits definiert • mittlerweile recht ausgereifte Systeme zur Unterstützung • Ontologie-Editoren, z.B. Protege • Beweiser für OWL • Anwendung als Technologie • Datenmodell wird als „Ontologie“ ausgedrückt • Beweiser übernimmt bestimmte Aufgaben, z.B. • Klassifikation: Inferenz der Taxonomie • Konsistenzprüfung • Kombination mit Abfrage-Sprachen (wie SPARQL) Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Beschreibungslogiken (DLs): Repräsentationsformalismen für terminologisches Wissen gesucht: DLs mit „guten“ Berechenbarkeitseigenschaften, effizient implementierbar Modellierungsprimitive Konzepte (unäre Prädikate) Rollen (binäre Prädikate) Konstruktoren / Konstruktionen(ALCUE = S, HOINQRF) OWL 1.0 - SHOIN OWL 1.1 - SROIQ Bsp.: OWL (formal): Beschreibungslogik Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Ontologie-Forschung • Problemfeld: Ontologie-Erstellung • Ontological Engineering • Methodologien zur Ontologie-Erstellung • Ontologie-Editoren / Verwaltungstools • Lernen / Verfeinerung von Ontologien • Problemfeld: Ontologie-Integration • Vergleiche, Abbildungen, kombinierte Verwendung • Suche nach weitgehend automatischen Verfahren • Problemfeld: Ontologie-Verwaltung • Modularisierung • Versionierung • Evaluation Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Zusammenfassung • Definitionen • Ontologie vs. Ontologien, Semantic Web Ontologien • Hintergrund & Zielstellung • semantische Interoperabilität • Wiederverwendbarkeit unterstützen (z.B. von Software) • Anwendungsbereiche • vielfältig, viele Systeme derzeit in Biologie & Medizin • Einteilungen • nach Formalisierungsgrad (weniger relevant für SW) • nach Allgemeinheit der Inhalte (Top-level ... Domänenontologien) • Semantic Web Ontologien • werden erfasst in OWL, basieren auf Beschreibungslogik Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme
Cocchiarella, Nino 1991„Formal Ontology“, In: Handbook of Metaphysics and Ontology, p.640-647, Philosophia. Guarino, Nicola 1998„Formal Ontology and Information Systems“, In: FOIS Proceedings, p.3-15, IOS Press. Gruber, Tom 1993„A Translation Approach to Portable Ontology Specifications”,Knowledge Acquisition 5(2):199-220. Gruber, Tom 2008„Ontology“, to appear in: Encyclopedia of Database Systems, Springer. Herre et al., 2007General Formal Ontology (GFO) – A Foundational Ontology Integrating Objects and Processes, Version 1.0.1 (draft). University of Leipzig. Neches et al., 1991„Enabling Technology for Knowledge Sharing”, AI Magazine 12(3):36-56. Seibt, Johanna 2004pers. Kommunikation. Sowa, John F. 2000„Knowledge Representation“, Brooks/Cole. W3C 2000 (Berners-Lee, Tim)„Semantic Web – XML2000“, Slides. Referenzen Vorlesung „Wissensrepräsentation“ Universität Leipzig, Abt. Intelligente Systeme