360 likes | 648 Views
Ontologie-basierte Informationsnutzung. 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet: Multimedia und Internetanwendungen (Univ.-Prof.Dr.-Ing. M.L. Hemmje)
E N D
Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet: Multimedia und Internetanwendungen (Univ.-Prof.Dr.-Ing. M.L. Hemmje) Thema: Daten-, Informations- und Wissensmanagement im Internet FernUniversität Hagen ws2006/07- Christina Sergel
1.0 Inhalt • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
1.0 Semantische Heterogenität • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
1.1 Semantische Heterogenität • Konflikte durch semantische Heterogenität: • Verwechslungskonflikte:Käfer = Auto oder Tier? • Skalierungskonflikte:3-Sterne Hotel = traumhaftes Hotel? • Namenskonflikte:Lehrer = Angestellter = Person • Mangel für ein gemeinsames Verständnis: • nicht eindeutig, dadurch Kommunikationsschwierigkeiten • Unterschiedliche Spezifizierungen für ein System Ontologien als Lösung
2.0 Ontologien • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
Der Begriff Ontologie Was sind Ontologien Konzeptualisierung Gemeinsam genutztes Vokabular Spezifikation des Wissenskontexts Sinnvolle Anwendungen Bild: Zoologische Staatssammlung München 2. Ontologien
2.1 Der Begriff Ontologie • Disziplin der Philosophie • die Lehre vom Sein. • Im Kontext der Informationstechnologie„An Ontology is a formal, explicit specification of a shared conceptualization“ [Gruber,1993] • besteht aus 4 Komponenten: Konzepte, Instanzen Relationen, Axiome. Bild: DERRIDA‘S MACHINES 2004:Polycontextural modelling of polysemy
2.2 Was sind Ontologien • Ontologie als ein kontrolliertes Vokabular Eine Menge von Begriffen mit sehr detaillierter und eindeutigen Beschreibung. Einigung auf gemeinsame Sprache • Ontologie als Taxonomien hierarchisch strukturierte IST-EIN-Beziehung von Konzepten und Begriffen: Branchenbuch,ISO-Nr. • Ontologie & Schemata • Schemata beschreiben die Definition von Bedingungen, zB Typen, Schemata werden entworfen für eine spez. Applikation • Web-Ontologie sind Taxonomien mit Inferenzregeln Das Ziel ist ein bestimmtes Fachgebiet mit einer großen Community zu konzeptualisieren. Bild: Zoologische Staatssammlung München
ein abstraktes Modell von Konzepten und seinen Beziehungen für ein allgemein anerkanntes Weltbild Ein Konzept ist eine gedankliche Vorstellung über ein reales Ding in der Welt. Eine explizite Spezifizierung gibt den Konzepten und Beziehungen des abstrakten Modells explizit Namen und Eigenschaften. Semantisches Dreieck von Ogden et al. 2.3 Konzeptualisierung
2.4 Gemeinsam genutztes Vokabular Eigenschaften von begrifflichen Ordnungssystemen [RWTH01] Für ein gemeinsames Verständnis für Mensch und Maschine: • Erstellung eines standardisierten und „kontrollierten“ Vokabulars, das von allen Beteiligten allgemein anerkannt und genutzt wird. • Vokabular muss einschränkend + spezifisch genug sein, • hinreichend flexibel + so allgemein wie möglich, • Disjunkt (Pizza<> Eis )und vollständig (Länder einer Welt) Martin Pflüglmayer: Computerbasierte Terminologie:“Medizinische Ordnungssysteme, Terminologien und Ontologien“; Aachen 2001
Die CyC-Wissens-Pyramide hunderttausende Begriffe Formt eine Upper-Ontologie Seit April 2006 unabhängige non-profit Organisation OpenCyC Ontologisches Wissen + passende Inferenzmechanismen Eigene CyCL-Sprache Quelle: http://www.cyc.com/ 2.4.1 Commen Sense Knowledge CyC
2.5 Die Spezifikation des Wissenskontext dieser Apfel ist rot Rot (X) karmesinrot ist ein rot diese Person ist ein rot(er) [Quelle:Guarino: The ontological Level ‚95] • Wissen implementierungsunabhängig auf dem Wissenslevel in einer Repräsentationsform beschreiben • Wissen implementierungsabhängig von Programmiersprache und – konzepte spezifizieren.
2.5.1 Grad der Formalität • Total informal: Lose formulierter Text • Semi- informal • Kontrolliertes Vokabular reduziert Mehrdeutigkeiten :Glossare • Semi-formal • mit Regelsystemen kann Wissen schnell und einfach in Regeln ausgedrückt werden. Nachteil: Beschreibung komplexer Problembereiche • Frames, ein Modell zur Darstellung von Konzepten, meist als OO-Datenmodell implementiert • Semantische Netze, Knoten mit gerichteten Graphen • Rigoros Formal Prädikatenlogik mit verschiedenen Ableitungsregeln (HORN-Logik, Resolutionskalkül, Transitivität,Inverse) ermöglicht automatische Konsistenzüberprüfung und Inferenzfähigkeit: DL, TOVE, relationale Datenbanken Bild: D. Oberle, S. Staab, R Volz: Three Dimensions of Knowledge Representation in WonderWeb
2.5.2 Maß der Definitionstiefe Kriterien: Ausdrucksstärke, Inferenzmächtigkeit und Entscheidbarkeit • XML: Syntax für strukturierte Dokumente, keine Semantik • RDF: Datenmodell, dass Relationen zwischen Ressourcen eindeutig mit URIs beschreibt • RDFS: Stellt Mechanismen bereit, um Relationen zw. Attributen und Ressourcen zu definieren. • OIL: Ontology Interchange L.. Enthält entscheidbare Fragmente der Prädikatenlogik (DL) • OWL-L, OWL-DL, OWL-FULL Bild: Fensel, van Harmelen:OIL:An Ontology Infrastructure for the Semantic Web, 2001
2.6 Sinnvolle Anwendungsbereiche Kommu- nikation Information Retrieval System- technik Ontologie Inter- operabilität
2.6.1 Kommunikation • Normatives Modell: Ontologien als ein gemeinsamer Wissensspeicher (Archive, Gesetzestexte, Regeln) • Beziehungsnetzwerke: Ontologien stellen wirtschaftliche und soziale Beziehungsnetze bereit (FOAF) P2P-Systeme • Konsistenz und Mehrdeutigkeiten: konsistente Ontologie durch Reasoners • Integration von verschiedenen Ansichten: ffPoirot ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996
2.6.2 Systemtechnik • Spezifikation: von Anforderungen für ein IT-System (Dokumentation) • Zuverlässigkeit: informale bzw. formale Konsistenzüberprüfung • Wiederverwendbarkeit: easy to re-use-Bibliothek, Aufbau der Ontologie-Bibliotheken. • Erweiterbarkeit, Offenheit: Ontologie-Bibliotheken müssen erweiterbar sein
2.6.3 Interoperabilität • Ontologien als Austauschformat (KIF) Gemeinsam genutztes Vokabular erleichtert Interoperabilität Quelle:ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996
für die qualitative Suche (informal und formal) besseres Verständnis Für die Wissensgewinnung Ontologien für die Evaluation von Wissenssystemen Content Management Systeme (OntoWeb) 2.6.4 Information Retrieval ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996
Ontologien in der Informationintegration • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
3.1 Welche Rollen haben Ontologien • Repräsentation des InhaltsAufgabe der O. ist Wissensrepräsentation • Single-Ontologie-Ansatz • Multiple-Ontologie-Ansatz • Hybrid-Ansatz • Query-ModellZugriff auf die Wissensbasis • VerifikationWartung der Integration und Extension
Eine zentrale Ontologie globale Sicht auf unterschiedl. Sourcen Gemeinsam genutztes Vokabular Vergleich d. O. einfach, Enge Kopplung Keine Wiederverwendung v. O. Anfällig für Source-Änderungen Semantische Datenintegration?Quelle: Tzi: methodolgies for Ontology-Based Semantic Translationsekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning 3.1.1 Single-Ontologie-Ansatz: SIMS
Jede Informationsquelle hat seine eigene Ontologie (lokal View) Kein gemeinsam genutztes Vokabular autonom Lose Kopplung, keine ontologische Übereinstimmung Vereinfacht Integration Komplexität des O-Mapping O(n2) 1:1-Mapping beim OBSERVER, worst case: one way Mapping Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning . 3.1.2 Multi-Ontologie-Ansatz:zB. OBSERVER
Jede Ressource hat seine eigene Ontologie Aufgebaut aus dem global gemeinsam genutzten Vokabular Neue Ressourcen können leicht hinzugefügt werden Unterstützt Evolution und Erwerb Ontologien sind vergleichbar Query-Prozessing ist komplex Keine Wiederverwendung von O. Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning 3.1.3 Hybrid-Ansatz: z.B. COIN
3.2.0 Query-Modell Zentrale Aufgabe von Ontologien: • Inferenzen auf und Abfragen von Ontologien • Abfrage auf Ontologiestruktur • Abfrage von Fakten, Kriterien für ein Query-Modell: • Verständlichkeit: Abfrage mit O-Begriffen intuitiv? für welche Aufgaben kann es genutzt werden? Antworten klar und einfach ? • Query Plan: klare Beschreibungen für jeden Interaktionsschritt zwischen den Ontologien. • Optimierung: kann die Abfrage dramatisch beschleunigen.
3.3.0 Verifikation • Verifikation: nicht die Ontologie wird überprüft, sondern die Korrektheit nach Mappings von Globalen zu lokalen Ontologien und umgekehrt • Validation einer Ontologie: in wieweit entspricht die Ontologie dem Realitätsausschnitt, den sie abbilden soll • Nur möglich bei formalsprachlicher Spezifikation, die vollständig ist. (Query containment) • Qualität der Überprüfung ist von der Vollständigkeit einer Ontologie abhängig.
4.0 Framework für die Informationsnutzung • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
4.1 Framework für die ontologiebasierte Informationsnutzung 2 prinzipielle Methoden für gemeinsame Nutzung von Informationen: • Retrieval • Integration mit standardisiertem Vokabular Wiederverwendung von Ontologien
Architektur: Hybrid-Ansatz 3-Schichten Infrastruktur: Unterste Ebene: Daten, Metadaten und Ressourcen Middleware-Ebene: Mapping-Regeln, Verifikation, Transformation, Queries, Reformulierungen Oberste Ebene: wiederverwendbare Ontologien und gemeinsam genutztes Vokabular Quelle: M.Doerr: The CIDOC CRM, an Ontological Approach to Schema Heterogeneity, 2005 4.2 Infrastruktur eines Framework
5.0 Ontologische Vereinbarungen • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
Minimale Kodierungsabweichung Konzeptualisierung auf der Wissensebene Minimal ontological commitment: Zuviele Einschränkung begrenzt die Offenheit Zuwenige erhöht Inkonsistenz u. inkorrekte Modulierung Bild: Stuckenschmidt/Van Harmelen: Information Shraring 2003 5.1 Ontologische Vereinbarung
5.2 Der Übersetzungsprozess • Merging • Mapping • Ontology Aligning Quelle: SEKT:D4.2.2 State-of-the-art survey on Ontology Merging and Aligning V2, 2003 Ontologien importieren Ähnlichkeiten finden Mapping spezifizieren
6.0 Ontologie-Engineering • Semantische Heterogenität • Ontologien • Ontologien in der Informationsintegration • Framework für die ontologiebasierte Informationsnutzung • Ontologische Vereinbarungen • Ontologie-Engineering
Zweck und Anwendungsbereich identifizieren Ontologie – Aufbau Klassifizieren Strukturieren , Integration von existierenden Ontologien Validieren, Verifizieren Verfeinern Verwalten und Benutzbarkeit testen Evaluieren Bild: [Buitelaar: Human Language Technology for the Semantic Web; 2005] Ontologischer Lebenszyklus 6.0 Ontologie-Engineering
6.0 Zusammenfassung • Ontologien reduzieren semantische Heterogenität • Domain-Ontologien erfassen und formalisieren semantik-erhaltendes Wissen durch ein standardisiertes eindeutiges Vokabular • Applikations-Ontologien nutzen Ontologien für das Wissensmanagement (ecommerce, Medizin, Umwelt, Recht) • Die Verwaltung von schwach-strukturierten Ressourcen wird durch semi-automatisierte Übersetzung erleichtert