470 likes | 649 Views
Semantic Web. EINFÜHRUNG WAS IST SEMANTIC WEB? CHRISTIAN FUCHS KOMPOSITIONALITÄTSPRINZIP LINGUISTISCHE SEMANTIK GABRIEL REITZ XML & RDF ANDREAS KRÄMER RDFS & OWL LEONARD KRAMER. Gliederung. ENTWICKLUNG DES WORLD WIDE WEB PROBLEME DES WORLD WIDE WEB SEMANTIC WEB ALS LÖSUNG
E N D
Semantic Web EINFÜHRUNG WAS IST SEMANTIC WEB? CHRISTIAN FUCHS KOMPOSITIONALITÄTSPRINZIP LINGUISTISCHE SEMANTIK GABRIEL REITZ XML & RDF ANDREAS KRÄMER RDFS & OWL LEONARD KRAMER
Gliederung ENTWICKLUNG DES WORLD WIDE WEB PROBLEME DES WORLD WIDE WEB SEMANTIC WEB ALS LÖSUNG ANWENDUNGSMÖGLICHKEITEN METADATEN TAXONOMIE UND ONTOLOGIE
Entwicklung des World Wide Web • 1989: Entstehung des World Wide Web (WWW) • 1993: Veröffentlichung des ersten Browsers „Mosaik“ • ermöglichte die private Nutzung des WWW • Erschließung des Web durch die Wirtschaft • z.B. Online-Handel, Werbung • Web 2.0 • verstärkte soziale Interaktion im WWW
Probleme des World Wide Web • Große Informationsvielfalt • unüberschaubar • vorhandene Informationen werden nicht gefunden • Suchmaschinen helfen nur bedingt • suchen Strings • suchen keine Inhalte/Informationen • Informationen müssen z.T. impliziert werden
Probleme des World Wide Web Welche Gründe liegen diesem Problem zu Grunde? • klassisches Web richtet sich an den Menschen • der Mensch kann: • die Bedeutung von Informationen verstehen • Beziehungen zwischen Informationen herstellen • auf neue Informationen schließen
Semantic Web als Lösung • Teilaufgaben: • Suchmaschine: „Augenarzt“, „München“ • Augenärzte herausfiltern • Adressen im Stadtplan auf Erreichbarkeit prüfen • Sprechstunden mit eigenem Kalender vergleichen • Termin vereinbaren • Termin in eigenen Kalender eintragen • Chef informieren • optimale Verkehrsverbindung herausfinden • Fahrkarte kaufen
Semantic Web als Lösung • klassisches Web: • Online-Suche • Kommunikation über E-Mail • Semantic Web: • Informationen über Informationen (Metadaten) • Beziehungen zwischen Informationen kann hergestellt werden • neue Informationen können impliziert werden => ermöglicht maschinelle Erfassung von komplexen Systemen
Navigieren und Suchen • Kreuzkatalog • Eingrenzen der Suche durch vorgegebene Optionen
Navigieren und Suchen • Semantische Suchmaschine • lässt Eingaben in natürlicher Sprache zu • große Bedeutung von Fragewörtern • sucht nach der Information, nicht nach dem String • kann aus vorhandenen Informationen auf nicht vorhandene schließen
Personalisierte Informationssysteme • Unterstützt die individuelle Informationsverwaltung • Übernehmen von operativen und administrativen Aufgaben • Beispiel: Arztbesuch • Kalender mit Terminplanung • automatischer E-Mail-Versand • Reiseplanung und -buchung
Metadaten • Daten, die Informationen über andere Daten zur Verfügung stellen • z.B. Buch -> Autor, ISBN • keine eindeutige Unterscheidung (Frage des Standpunkts) • Speicherung von Metadaten • im Dokument selbst • zugeordnetes Nachschlagewerk (z.B. Bücherkatalog, Bibliotheksverzeichnis)
Metadaten • Interoperable Metadaten • inter: zwischen • operabel: es kann damit gearbeitet werden • Standards • machen Metadaten aus unterschiedlichen Quellen nutzbar
Taxonomie • Baumstruktur • monohierarchisch • jede Klasse hat nur eine Oberklasse • wird schon häufig verwendet • z.B. Bibliothek -> Stockwerke -> Regale -> Bücher • Problem: Keine Darstellung von Vernetzungen • Lösung: Ontologie!
Ontologie • Netzwerk von Informationen mit logischen Relationen • formale Beschreibung der Daten • Regeln zu deren Zusammenhang • kann nicht eingegebene Informationen ergänzen • kann Widersprüche erkennen
Ontologie • Bestandteile: • Begriffe: Stadt, Land • Instanzen: München, Deutschland • Relationen: München liegt in Deutschland • Vererbung: München erbt Eigenschaft „liegt in Europa“ von Deutschland • Axiome: „zwischen Deutschland und Amerika gibt es keine Zugverbindung“
Gliederung • Linguistische Semantik • Intensional • Klassematisch • Distinktiv • Extensional • Denotation • Konnotation • Kompositionalitätsprinzip, Formale Semantik • Metasprache • Objektsprache
Linguistische Semantik • Inhaltliche Bedeutung von sprachlichen Zeichen • Zeichen (Morpheme), Wörter (Lexeme), Satzglieder, Teilsätze, Sätze Zeichen Hier: Buchstabe „G“ Gabriel hält einen Vortrag über die Semantik, der unglaublich interessant ist. Wort / Ausdruck Teilsatz Hier: Satzglied Subjekt Hier: Relativsatz Satz
Unterscheidung: Intensional / Extensional • Intensionale Semantik • Beziehung zwischen verschiedenen Wörtern • Gemeinsamkeiten • Unterschiede • Extensionale Semantik • Denotation • Konnotation
Intensionale Semantik • Merkmale: Unterschiede und Gemeinsamkeiten Gleiche Generation männlich / weiblich • Unterschied: männlich / weiblich distinktives Merkmal • Gemeinsamkeit: gleiche Generation klassematisches Merkmal
Intensionale Semantik • Klassematische Merkmale: grün • Distinktive Merkmale: rot Regen nass trocken Licht Sonne Sterne hell Tag Mond dunkel Nacht
Extensionale Semantik • Denotation • Sachliche, wörtliche Bedeutung • Bezug auf Gegenstände aus der Wirklichkeit • Konnotation • Nebenbedeutungen, Emotionen, Bewertungen • Bezug auf Sprecher Zuhörer / Leser
Konnotation • Tatsächliche Bedeutung oft nicht erkennbar: Gabriel hält einen Vortrag über die Semantik, …der unglaublich interessant ist. …der uuunglaublich interessant ist… ;-) …der UNGLAUBlich interessant ist!!!
Fazit: Kompositionalität • Anwendung mehrerer Prinzipien notwendig • Gottlob Frege: Kompositionalitätsprinzip „Die Bedeutung eines komplexen, d.h. aus Teilausdrücken zusammengesetzten Ausdrucks ist durch die Bedeutungen seiner Teile sowie die Art ihrer Zusammenfügung bestimmt.“ • Anwendung auf 3 Ebenen: • Wortsemantisch • z.B. Determativkomposition: rabenschwarz • Satzsemantisch • Wörter und deren Verknüpfung Satzbedeutung • Formal • Metasprachen, Objektsprachen
Formale Semantik • Metasprache • „Regeln“ zur Analyse der Bedeutung von Komplexen aus der Objektsprache Metasprache Subjekt: Gabriel Prädikat: hält Objekt: Vortrag Gabriel hält einen Vortrag. Zähler: 3 Nenner: 5 Ergebnis: 0,6 3/5 = 0,6 Kopfgesteuerte Schleife zum Errechnen der Fakultät. while(i<zahl){ fakultaet = fakultaet*i; i++;} Objektsprache
XML – eXtensible Markup Language • XML steht für “erweiterbare Auszeichnungssprache” • XML ist eine Meta-Sprache (“Sprache über Sprache”) • DTD (Document Type Definition) grenzen Namensraum für Tags ein • Unicode Zeichenkodierung
XML – eXtensible Markup Language • XML Dokumente können “wohlgeformt” sein • Das Dokument besitzt genau ein Wurzelelement • Alle Elemente besitzen eine Start- und eine Endkennung • Ein Element darf nicht mehrere Attribute mit dem gleichen Namen besitzen • ... • Volle Spezifikation unter: • http://www.edition-w3c.de/TR/2000/REC-xml-20001006/#sec-well-formed
XML – eXtensible Markup Language • Ein Beispieldokument: Deklaration <?xml version="1.0" encoding="utf-8"?> <person> <name>Andreas Krämer</name> <geschlecht>männlich</geschlecht> </person> Start-Tag Ende-Tag Wurzelelement Attribut Selbstschließendes Tag <personname="Andreas Krämer" geschlecht="männlich" />
RDF – Resource Description Framework • 1999 von W3C veröffentlicht • Formale Sprache zur Beschreibung von Informationen • Kombination und Weiterverarbeitung von Informationen • Besteht aus Subjekt, Prädikat und Objekt • Grundlegendes Darstellungsformat für die Entwicklung des Semantic Web • RSS (RDF Site Summary) 1.0 baut auf RDF auf
RDF – Resource Description Framework • Darstellung • Gerichteter Graph • Knoten mit gerichteten Kanten • Knoten und Kanten haben eindeutige Bezeichner • Keine Baumstruktur http://stammbaum.org/ StammtAbVon http://stammbaum.org/ Säugetier http://stammbaum.org/ Tier
RDF – Resource Description Framework • Problem: Unterschiedliche Resourcen können gleiche Bezeichnungen in unterschiedlichen Dokumenten besitzen • Lösung: Eindeutige Bezeichner, sogenannte URIs (=Uniform Resource Identifier) • URIs beginnen in RDF immer mit http:// • Beispiel: • http://stammbaum.org/Tier
RDF – Resource Description Framework • Beispiel eines RDF Dokuments Deklaration <?xml version="1.0" encoding="utf-8"?> <rdf:RDFxmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:ex ="http://stammbaum.org/"> <rdf:Descriptionrdf:about="http://stammbaum.org/Säugetier"> <ex:StammtAbVon> <rdf:Descriptionrdf:about="http://stammbaum.org/Tier"> </rdf:Description> </ex:StammtAbVon> </rdf:Description> </rdf:RDF> Namensraum
RDFS - Einordnung • RDFS: Ressource Description Framework Schema • Für leichtgewichtige (eng: lightweight) Ontologien
Zusammenhang RDF und RDFS • RDFS:<rdf:RDF xmlns:ex=“http://www.ba-mannheim.de/Semantic/“><rdfs:Class rdf:about=“&ex;BAStudent“> <rdfs:label>Student an der BA Mannheim</rdfs:label></rdfs:Class> • RDF:<ex:BAStudent rdf:about=“Leonard Kramer“ />
Typische RDFS-Elemente • Klassen: • Class • subClassof(vgl. Java: extends) • Label (Erklärung / Bezeichnung für die Klasse) • Beziehungen • Propertys • subPropertyOf • domain(schränkt den Wertebereich des Subjekts ein) • range(schränkt den Wertebereich des Objekts ein) PiepmatzwirdGefressenVon Raubvogel
Beispiel: Biologischer Stammbaum <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“ xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“ xmlns:ex=“http://www.stammbaum.org#“> <rdfs:Classrdf:about=“&ex;Tiere“> <rdfs:labelxml:lang=“de“>Gesamte Tierwelt</rdfs:label> </rdfs:Class> <rdfs:Classrdf:about=“&ex;Säugetiere“> <rdfs:labelxml:lang=“de“>Alle Säugetiere</rdfs:label> <rdfs:subClassOfrdfs:resource=“&ex;Tiere“ /> </rdfs:Class>
Beispiel: Biologischer Stammbaum • Stammbaum mit Hierarchie abgebildet • Säugetiere gehören zur Gruppe der Tiere
Beispiel: Propertys <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#“ xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#“ xmlns:ex=“http://www.stammbaum.org#“> <rdf:Propertyrdf:about=“&ex;hatFohlenMit“> <rdfs:Rangerdf:resource=“#Pferd“ /> <rdfs:Rangerdf:resource=“#weiblich“ /> <rdfs:Domainrdf:resource=“#Pferd“ /> <rdfs:Domainrdf:resource=“#männlich“ /> </rdf:Property> Pferd weiblich Pferd männlich hatFohlenMit
Probleme von RDFS • Weitere differenzierte Beschreibung von Beziehungen nicht möglich • Keine Mengenaussagen • Kaum Logikaussagen ableitbar
OWL • OWL: Web Ontology Language • Im Februar 2004 vom W3C als Ontologiesprache standardisiert • Sprich \ˈau̇(-ə)l\ (Englisch: Eule) • Hintergrund: Eulen werden mit Weisheit assoziiert
OWL-Versionen • OWL Full • Sehr ausdrucksstark • Wird von aktueller Software nur bedingt unterstützt • OWL DL (Description Logics) • Teilsprache von OWL Full • Wird von aktueller Software fast vollständig unterstützt • Quasi-Standard • OWL Lite • Teilsprache von OWL Full und OWL DL • Weniger ausdrucksstark
OWL - Einordnung • Für schwergewichtige (eng: heavyweight) Ontologien
Beispiel-OWL-Implementierungen • FOAF (Friend of a Friend) • Modellierung sozialer Netzwerke • Angaben über eine Person, wie Hobbys, Name, Fotos etc… • Beer • Ontologie zur Beschreibung und Kategorisierung von Biersorten • Angaben über Auszeichnungen, Bierart, Brauerei, Zutaten…
OWL in der Praxis • Vodafone Live! Mobile Portal • Vodafone-Portal für Handy-Downloads (Spiele, Filme, etc…) • interne Datenverwaltung mit RDF • Verbesserung in der Suche: 50% weniger Seitenaufrufe pro Download • Semantic-Web-Suchmaschinen • Aggregation von semantischen Daten (s. vorherige Folie) • Beispiele: Swoogle, Sindice • Ergebnisse können noch nicht überzeugen
Zukunftsperspektive • Implementierungen werden ausgereifter • Anwendungsspektrum wird wachsen • Ontologien stellen die nächste Stufe des Web dar (Web 3.0) • Täglich mehr Ontologien verfügbar • Neue Geschäftsfelder entstehen • Suchmaschinen • Spezifische Portale, die in der Lage sind Wissen zu verknüpfen • …