480 likes | 618 Views
Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web. Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON). Niko Kwekkeboom. Seminar im Sommersemester 2007: Agenten im Semantic Web. Gliederung. Einleitung Semantic Web Grundlagen
E N D
Informatik-Seminar im Sommersemester 2007 Agenten im Semantic Web Ontologien im Semantic Web Am Beispiel der KArsruhe ONtology and Semantic Web Infrastructure (KAON) Niko Kwekkeboom Seminar Agentim im Semantic Web| 2007-06-22
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 2
Beispiel: Die -Suche • Suchbeispiel: „Golf“ • ~390.000.000 Treffer (20.06.2007) • Umfassen Golfsport, VW Golf, Golf von Mexico etc. 1. Einleitung 3
Beispiel: Die -Suche • Suchmaschinen indizieren Webseiten • Schlüsselwörter, Häufigkeiten, Verlinkung • Ranking-Kriterien geheim • Suchmaschine abhängig von guten Nutzereingaben für qualitative Ergebnisse • Bedeutung der Suchbegriffe kann nicht interpretiert werden • Unzulänglichkeiten in den vorhandenen Suchmöglichkeiten 1. Einleitung 4
Semantic Web – Status quo • Semantic Web nicht als Ablösung, sondern Erweiterung des bestehenden Webs gedacht • Aktuelles Web Sammlung von menschenverstehbaren Daten • Suchergebnisse bzw. Rechnerunterstützung im allgemeinen unbefriedigend „The Semantic Web is not a separate Web but an extension to the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” Tim Berners-Lee, Scientific American, May 2001 1. Einleitung 5
Semantic Web – Ziel • Sprachentwicklung zur Darstellung von Informationen in maschinenverstehbarer Form • Ziel: Daten maschinenverstehbarer gestalten und somit die Mensch-Maschine- und die Maschine-Maschine-Kommunikation verbessern Der Computer weiß, ob bei der Eingabe Golf als Auto, Sport oder Ort gemeint ist 1. Einleitung 6
Semantic Web – Anmerkung • Semantic Web immer noch eher Idee als Technologie • Umsetzung steckt noch in den Ansätzen • Konzepte und Technologien noch in den „Kinderschuhen“ • Vor allem Standardisierung dringend nötig 1. Einleitung 7
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 8
Semantic Web – Architektur • Schichtenmodell des Semantic Web: Trust Rules Proof Data Logic Data Digital Signature Ontologyvocabulary Self- desc. doc. RDF + RDFS XML + NS + xmlschema Unicode URI 2. Semantic Web Grundlagen 9
Semantic Web – Architektur Grundlage • Unicode: Plattformunabhängige, eindeutiger Standard zur Zuordnung von Zeichen zu Zahlen • URI (Unified Resource Identifier): Identifizierung einer abstrakten oder physikalischen Ressource Erweiterung • XML (eXtensible Markup Language): Technologie zur Formatierung von Dokumenten mit flexibler Struktur (Gegensatz zu HTML) • xmlschema: Grammatik für XML-Dokumente, Regeln für syntaktischen Aufbau • Selbst XML-Dokument • Namensräume (NS) zur Verhinderung von Konflikten eingeführt XML + NS + xmlschema Unicode URI 2. Semantic Web Grundlagen 10
Semantic Web – Architektur RDF + RDFS • RDF (Resource Description Framework) • Setzt auf XML auf • Modell zur Repräsentation vom Metadaten • Konstruktion aus Statements, bestehend aus: Ressourcen, Eigenschaften, Aussagen • RDFS (Resource Description Framework Schema): • Beschreibt die Semantik eines RDF-Dokumentes, Aufbaukriterien festgelegt • Ermöglicht Klassenbildung und somit Hierarchien und Ableitungen 2. Semantic Web Grundlagen 11
Semantic Web – Ontologien Ontologyvocabulary • Ontology: Formale Beschreibung von Gegenständen und deren Beziehungen zueinander • Basierend auf RDF(S) und Erweiterung (RDF: Programmiersprache; Ontologie: Programm) • Meist lediglich kontrollierte Vokabularien • Komplexe Relationen über Relationen eher selten gebraucht • Zentraler Bestandteil der Vision des Semantic Web • Ziel: Schaffung einer gemeinsamen Sprache • Je nach Nutzen kategorisier- und einteilbar • Nicht „die eine“ Ontologie; OWL als Empfehlung des W3C 2. Semantic Web Grundlagen 12
Semantic Web – Architektur • Keine technologischen Erweiterungen, sondern Regelung darunter liegender Schichten • Logic: Daten in maschinenverarbeitbarer Form, ermöglicht Anfragen mit boolschen Operatoren, Quantoren und Kardinalitätsbeschränkungen • Proof: Agenten befähigen angebotene Beweise selbstständig nachzuvollziehen Datenquellen für Nutzer ersichtlich • Trust: Korrekte Informationen nötig, in offener Architektur schwierig sicherzustellen „trusted rating services“ zur Bewertung von Quellen Rechtevergabe: „Wo darf ein Agent was?“ • Digital Signature: Zur Missbrauchsverhinderung des Semantic Webs verlässliche digitale Signatur erforderlich • Proof und Trust bisher nur rudimentär verwendet, in Zukunft steigende Wichtigkeit Trust Proof Logic Digital Sig. 2. Semantic Web Grundlagen 13
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 14
Kommunikation • Zur Kommunikation ist eine gemeinsame Sprache nötig, d.h.: • Übereinkunft über gemeinsame Symbole und Begriffe (Index), • deren Bedeutung (Glossar), • Klassifikation von Begriffen (Taxonomie), • Assoziation bzw. Vernetzung von Begriffen (Thesaurus/Topic Map) • Regeln und Wissen (Erfahrungen) darüber, welche Vernetzungen zulässig und sinnvoll sind (Ontologie). • Trifft in besonderem Maße auf die Kommunikation mit Maschinen zu 3. Ontologien 15
Ontologien – Definition • Wortursprung im Griechischen: „ontos“=„sein“, „logos“=„Wort“ • Ursprüngliche Bedeutung in der Philosophie: Lehre des Seins und Seienden(Abgrenzung von der Lehre der verschiedenen Lebewesen in den Naturwissenschaften) • Untersuchung und Beschreibung der Realitäten und der Existenz von Dingen • Dinge sind als Grundlage klar definiert und akzeptiert • Verwand mit der Erkenntnistheorie 3. Ontologien 16
Ontologien – Definition: Informatik • In der Informatik umfasst der Begriff Ontologien Techniken zur formalen Modellierung von Begriffssystemen • Konstruktion daher stark kontextabhängig (Komplexität/Einsatzzweck) • Formalisiertes Modell der Welt (Domäne) oder ein Teil der Welt (Sudomäne) • Keine einheitlichen, allgemeinen, vollständigen Regeln zur Konstruktion Hoher intellektueller und logistischer Aufwand 3. Ontologien 17
Ontologien – Aufbau • Dreigeteilter Aufbau: 3. Ontologien 18
Ontologien – Elemente 3. Ontologien 19
Ontologien – Typen • Top-Level Onthology: Weitgehend domänenunabhängiges Weltwissen z.B. Zustand, Zeit, Prozess etc. (Bsp.: „CyC“ oder „WordNet“) • Task Ontology, Domain Model Ontology: Grundlegendes (Sub-)Domänen-Vokabular (Bsp.: „UMLS“ – Unified Medical Language System) • Application Ontology: Von Domäne und Aufgabe abhängige Konzepte und Definitionen, i.d.R. Spezialisierung der anderen Zwei (Bsp.: „KA2 Ontology“) Top-Level Ontology Domain Ontology Task Ontology Application Ontology 3. Ontologien 20
Ontologien – Sprachen (Schichtstruktur) • 2 Kategorien • Traditionelle in HTML • Webbasierte auf XML • RDF/RDFS als Grundlage für: • OIL (Ontology Inference Language) – europäische Entwicklung • DAML (DARPA Agent Markup Language) – parallele amerikanische Entwicklung • Zusammenschluss zu OWL (Web Ontology Language) – gemeinsame Weiterentwicklung Empfehlung des W3C für OWL (Februar 2004) OWL DAML & OIL DAML OIL RDFS RDF XHTML HTML XML 3. Ontologien 22
Ontologie – Sprachen: OWL • Spezifikation des W3C zur Erstellung, Publikation und Verteilung von Ontologien anhand formaler Beschreibungssprache • Erlaubt Beschreibung von Wissen auf maschinenlesbare Weise;Abbildung in dieser Logik ermöglicht eine formale Syntax und lässt logisches Schließen zu • Leichte Verständlichkeit und hohe Kompatibilität durch starke Einbindung von RDF und XML Syntax • Ausdrucksmächtigkeit geht über RDF hinaus; Sprachkonstrukte werden eingeführt, um Ausdrücke ähnlich der Beschreibungslogik formulieren zu können • Zielsetzung: „Die“ Ontologiesprache des Internet zu werden • Teilweise Anforderungen inkompatibel, daher Definiton in drei Versionen 3. Ontologien 23
Ontologie – Sprachen: OWL • OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik-Kalkülen nichtmehr erschließbar • OWL DL: OWL Description Logic Verlangt Typenunterscheidung Klassen & Attribute brauchen eindeutige Zuordnung • OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1 Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke OWL Full OWL DL OWL Lite 3. Ontologien 24
Ontologie – Werkzeuge • Erfolg neuer Technologien hängt eng mit der Qualität verfügbarer Werkzeuge zusammen • Kategorien an Ontologie-Werkzeugen: • Entwicklungswerkzeuge • Kombinations- und Integrationswerkzeuge • Evaluationswerkzeuge • Annotationswerkzeuge • Speicher- und Anfragewerkzeuge • Lernwerkzeuge 3. Ontologien 26
Ontologie – Probleme • Ontologien große Rolle bei der Entwicklung des Semantic Web • Entwicklung noch nicht ausgereift, somit problematisch • Keine „die“ Ontologie – fehlender Standard • Entwicklungstools für Ontologien noch in Entwicklungsphase 3. Ontologien 27
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 28
KAON – Eckdaten • http://kaon.semanticweb.org • Java 1.4 Plattform • SQL-DB (JBoss/Tomcatopt.) • Open Source (GNU LGPL) • Begonnen 2001 • Version 1.27 (2005) 4. KAON 29
KAON – Entwicklung • Entwickelt durch Forschungszentrum Informatik (FZI) Karlsruhe und AIFB (Institute of Applied Informatics and Formal Description Methods der Universität Karlsruhe) • Tool Suite zur Erstellung und Verwaltung von Ontologien (Open-Source Infrastruktur) • Module, zur Erstellung und Realisierung von ontologiebasierten Anwendungen • Unterstützt klassische Ontologien- und Wissensmanagement-Konzepte, sowie relationale Datenbanksysteme • Referenzanwendung: VISION-PortalSemantisches „browsing und querying“ PortalUnterstützt Wissensmanagement bezüglich Unternehmen, Projekten, Forschungsgebieten und Software(derzeit nicht verfügbar!) 4. KAON 30
KAON – Ontologie Sprache • Sprache wurde inkrementell entwickelt um Skalierbarkeit mit großen Ontologien und Wissensdatenbanken zu erhalten • Zuerst einfache an RDFS orientierte Kernsprache („Karsruhe perspective on ontologies“) • Definition von Konzepten, Relationen und teilweise Befehle hierauf • Zentral: Unterstützung der Lexikalisierung von Konzepten und Relationen • Tools: Simple Onotology Editor (KAON SOEP), Datenbank Mapper (KAON REVERSE), Prototyp für Views auf Ontologien (KAON VIEWS) • Spätere Erweiterung („Ontology-Instance (OI) models“) • Unterstützung von logischen Axiomen (Symmetrie etc.), Modularisierung, strikte Trennung von Ontologien und Insanzen, übergreifende Objekte • Komplette Überarbeitung der KAON API • Neue Tools: KAON Portal, KAON OI-modeler 4. KAON 31
KAON – Ontologie Sprache (2) • Versuch 2 Sprachen parallel zu unterstützen • Bisher entwickelte proprietäre Sprache • OWL • Voller Sprachumfang von OWL für viele Anwendungen nicht benötigt • Bsp.: TEXTONTO extrahiert (semi-automatisch) semantische Zusammenhänge aus Texten Komplexe OWL-Axiome hier überfordernd Letztendlich gewinnt OWL Oberhand, daher neue Entwicklung 4. KAON 32
KAON – Module • Frontend – Hauptsächlich 2 Darstellungsformen • OI-Modeler (oimodeler) • KAON Portal (kaonportal) • Core – 2 zentrale APIs • KAON Ontology Language (apionrdf, apiproxy, engineeringserver, kaonapi, query) • RDF (rdfapi, rdfcrawler, rdfserver) • Libraries – Verschiedene Bibliotheken innerhalb KAONS auch außerhalb nutzbar • z.B. datalog, guibase, etc. 4. KAON 33
KAON – Vorführung: Workbench (OI-Modeler) 4. KAON 34
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 35
Zur Erinnerung: OWL DL (Folie 24) • OWL Full: Sämtliche existierende Sprachkonstrukte Bedeutung von vordefinierten Konstrukten veränderbar Nachteil: Mit Logik-Kalkülen nichtmehr erschließbar • OWL DL: OWL Description Logic Verlangt Typenunterscheidung Klassen & Attribute brauchen eindeutige Zuordnung • OWL Lite: Eingeschränkter als OWL DL Klassen nur bezüglich Oberklasen definierbar Sämtliche Relationen und Restriktionen nur auf benannten Klassen anwendbar Nur Kardinalitäten 0 und 1 Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke OWL Full OWL DL OWL Lite 3. Ontologien 36
KAON2 – Entwicklung • Seit Juli 2005 Nachfolger von KAON (letzte veröffentlichte Version von KAON) • Entwickelt von Forschungskooperation aus: • Forschungsgruppe Information Process Engineering (IPE) am Forschungszentrum Informatik (FZI Karlsruhe) • Institute of Applied Informatics and Formal Description Methods (AIFB) and der Universität Karlsruhe • Information Management Group (IMG) an der University of Manchester 5. KAON2 37
KAON2 vs. KAON(1) • Unterscheidung durch unterstütze Ontologie Sprachen: • KAON verwendet proprietäre RDF(S) Erweiterungen • KAON2 basiert auf OWL-DL und F-Logic Beide Systeme somit nicht kompatibel ! 5. KAON2 38
KAON2 – Ausstattung • Entwicklungswerkzeug für Ontologien basierend auf (über APIs): • OWL-DL • SWRL (A Semantic Web Rule Language – OWL+RuleML) • F-Logic (Frame Logic) • Features • Eigener Ontologie-Server, der Remote Methoden Zugriffe zulässt (RMI) • Anfragewerkezeuge um kombinierende Abfragen zu erstellen (SPARQL Syntax) • DIG-Interface für externe Tool-Zugriffe (Bsp. Protégé) • Extraktions-Modul zur Entnahme von Instanzen aus relativen DB 5. KAON2 39
KAON2 – Projekte • Entwicklung teilweise duch EU IST project DIP 507483 finanziert • Verwendet in: • EU IST project OntoGov • EU IST project SEKT (und erweitert) • BMBF project SmartWeb • DLP translator (Grundlage) 5. KAON2 40
KAON2 – OWL-Tools • Version 0.27: 16 Funktionen (Auswahl): • dump: gibt die Axiome und Entitäten der Ontologie aus • latex: gibt die Axiome in lateX-integrierbarer Form aus • filter: entfernt alle Axiome eines Typs • count: gibt die Anzahl an Axiomen (oder Entitäten) zurück • diff: zeigt alle Axiome die eine Ontologie mehr als eine andere hat an • merge: gibt eine Ontologie mit allen Axiomen zweier Input-Ontologien zurück • deo: ersetzt “nominals” durch einfache Klassen (schwächt so die Ontologie) • populate: füllt eine Ontologie zufällig mit Instanzen • dlpconvert: wandelt eine DL Ontologie in Regeln um • satisfiable: prüft die Reichhaltigkeit einer Ontologie 5. KAON2 41
KAON2 – Anmerkung • Kommerzielle Version OntoBroker OWL, für Wissenschaft kostenlos • Vollständig in Java 1.5 implementiert • Benötigt JDK zur Ausführung; zusätzlich Apache ANT für Beispiele • Keine Verarbeitung von „nominals“ (Excptions bei: owl:oneOfclass und owl:hasValue)Große Kardinalitäten können (abhängig von anderen Axiomen) nicht verarbeitet werdenSomit keine volle OWL DL Abdeckung! (OWL Lite voll abgedeckt) • Dokumentation bisher nur an Beispielen vorhanden 5. KAON2 42
Und was macht die Konkurrenz? • Protégé sehr verbreitet • Gut dokumentiert • Volle OWL-Unterstützung • Open Source • Plugin-Nutzung • Schnittstelle zu KAON2 Weitere: • CyC – Abbildung Weltwissen • WordNet – Wörterbücher 5. KAON2 43
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 44
Zusammenfassung • Ontologien als semantisch „reichste“ Ebene der Kommunikation • Ontologien als zentraler Aspekt des Semantic Web • OWL als W3C empfohlene Sprache für Ontologien • Erfolg neuer Technologien abhängig von verfügbaren Tools • Derzeit verfügbare Werkzeuge noch in den „Kinderschuhen“, nicht massentauglich • Viele Projekte/Forschung um dies zu ändern 6. Zusammenfassung
Ausblick • Große Hürde: Anwender finden, die Mehraufwand betreiben um maschineninterpretierbare Webinhalte zu erstellen • Kritische Masse an verfügbaren Inhalten muss erreicht werden, bevor Technologien nutzbar werden • Gut entwickelte Ontologien nötig um mit semantischem Markup Bedeutung herzustellen • Standardisierung erforderlich um parallel Entwicklung nicht kompatibler Systeme zu verhindern 6. Zusammenfassung
Das Semantic Web – Eine Vision • Semantisch angereicherte Daten im Web • Voll maschineninterpretierbare Daten, ermöglichen „Mitdenken“ des Rechners • Persönlicher Web Agent • Reiseplanung • Logistikplanung • Terminplanung • Fremdverfügbarkeit • Kooperative Web Agenten • etc 6. Zusammenfassung
Seminar im Sommersemester 2007:Agenten im Semantic Web Gliederung Einleitung Semantic Web Grundlagen Ontologien KAON KAON2 Zusammenfassung Fragen und Diskussion 48
Fragen Nööö… 7. Fragen und Diskussion
Diskussion • Welche Technologien außer Ontologien können noch einen großen Einfluss auf den Erfolg des Semantic Web haben? • Wo liegen die Vor- und Nachteile von modularen oder globalen Wissenssammlungen? Was überwiegt? 7. Fragen und Diskussion