280 likes | 424 Views
Eigene Erweiterungen für SKOS. Klaas Dellschaft klaasd@uni-koblenz.de. Überblick. Wissensbasen im Semantic Web RDF/OWL-Ontologien T-Box A-Box Modellierung von Thesauri mit SKOS Thesaurus-Schema Thesaurus-Daten Erweiterungen für SKOS SKOS-XL Koordinierte Konzepte
E N D
Eigene Erweiterungen für SKOS Klaas Dellschaftklaasd@uni-koblenz.de
Überblick • Wissensbasen im Semantic Web • RDF/OWL-Ontologien • T-Box A-Box • Modellierung von Thesauri mit SKOS • Thesaurus-Schema Thesaurus-Daten • Erweiterungen für SKOS • SKOS-XL • Koordinierte Konzepte • Ableitung von Entwurfsmustern
Wissensbasen – RDF/OWL-Ontologien (I) ThesaurusKonzept rdf:type id-4037945-0 hatLabel „Mathematiker“ • RDF: Resource Description Framework • Repräsentiert Aussagen in der Form<Subjekt> <Prädikat> <Objekt> id-4037945-0 rdf:type ThesaurusKonzept id-4037945-0 hatLabel „Mathematiker“
Wissensbasen – RDF/OWL-Ontologien (II) • RDFS: RDF Schema • Modellierung des Schemas einer Anwendungsdomäne • rdfs:class, rdfs:subClassOf • rdfs:property, rdfs:subPropertyOf, rdfs:domain, rdfs:range • OWL: Web Ontology Language • Erweiterte Modellierungsmöglichkeiten • owl:class, owl:unionOf, owl:intersectionOf, owl:sameAs • owl:ObjectProperty, owl:DatatypeProperty
Wissensbasen – T-Box vs A-Box • T-Box (Terminological Box) • Enthält z.B. die Klassen- und Beziehungshierarchie • Stellt das Vokabular bzw. Schema einer Ontologie dar • A-Box (Assertional Box) • Enthält die Aussagen über Individuen bzw. Instanzen • Aussagen entsprechen dem durch die T-Box vorgegebenen Schema • Inferenz • Klassifizierung von Instanzen • Ableitung von Beziehungen zwischen Instanzen basierend auf Informationen in der T-Box (z.B. Transitivität) • Überprüfung auf Inkonsistenzen und Widersprüche (z.B. disjunkte Klassen)
Modellierungsebenen eines Thesaurus • Thesaurus-Schema • Label, Konzepte, Relationstypen zwischen Konzepten, … • Beispiele: SKOS oder RDA Element Sets • T-Box • Thesaurus-Daten • Konkrete Konzepte/Terme und deren Beziehungen • Beispiele: SWD, DDC, LCSH, … • A-Box • Welche Art von Wissen kann durch einen Reasoner inferiert werden?
SKOS – Modellierung eines Thesaurus-Schemas SKOS wird benutzt um Mengen von Konzepten und deren semantische Beziehungen zu modellieren Konzepte werden in Konzeptschemata gruppiert skos:concept, skos:prefLabel, skos:altLabel, … skos:broader/narrower, skos:related, … Beziehungen zwischen zwei Konzeptschemata skos:exactMatch: Äquivalenz von zwei Konzepten skos:closeMatch: Ausreichend ähnliche Konzepte, um sie in einigen Retrievalanwendungen austauschbar nutzen zu können skos:broadMatch: Hierarchische Beziehung skos:relatedMatch: Assoziative Beziehung
SKOS – Modellierung des Thesaurus-Schemas owl:ObjectProperty rdfs:domain rdf:type skos:Concept skos:semanticRelation skos:Concept rdfs:range rdfs:subPropertyOf rdf:type skos:broaderTransitive owl:TransitiveProperty rdfs:subPropertyOf owl:inverseOf skos:broader skos:narrower
SKOS – Modellierung der Thesaurus-Daten skos:prefLabel id-4058020-9 „Streichinstrument“ skos:broader skos:prefLabel „Violine“ id-4019791-8 skos:altLabel „Geige <Violine>“ skos:broader skos:prefLabel „Elektronische Geige“ skos:altLabel id-7694541-8 „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Inferenz von Wissen (I) skos:prefLabel skos:Concept rdf:type id-4058020-9 „Streichinstrument“ skos:broader skos:prefLabel „Violine“ rdf:type skos:Concept id-4019791-8 skos:altLabel „Geige <Violine>“ skos:broader skos:prefLabel „Elektronische Geige“ skos:altLabel skos:Concept id-7694541-8 rdf:type „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Inferenz von Wissen (II) skos:prefLabel id-4058020-9 „Streichinstrument“ +skos:broader Transitive skos:broader skos:prefLabel „Violine“ id-4019791-8 skos:broaderTransitive skos:altLabel „Geige <Violine>“ +skos:broader Transitive skos:broader skos:prefLabel „Elektronische Geige“ skos:altLabel id-7694541-8 „Elektrische Violine“ skos:altLabel „E-Violine“
SKOS – Zusammenfassung • SKOS = Simple Knowledge Organization System • Ziel: Gemeinsames Schema zur Darstellung von Thesauri, Klassifikationssystemen und Taxonomien • Konzepte werden in Schemata organisiert • Konzepte können annotiert werden mit … • … beliebig vielen Labeln (Strings) in beliebigen Sprachen • … Notationen (z.B. „368.01023“) • … Benutzungshinweisen, Definitionen, Beispielen, … • Konzepte können … • … in Relation zueinander gesetzt werden • … gruppiert werden • … aufeinander gemappt werden
SKOS eXtension for Labels (SKOS-XL) • Problem: • Label sind einfache String-Literale • Ein Label kann nicht als Subjekt in RDF verwendet werden • Beispiel: • Wie können z.B. Akronyme von Synonymen unterschieden werden? skos:prefLabel „Frankfurt <Main> / Deutsche Bibliothek“ skos:altLabel id-4071342-8 „Deutsche Nationalbibliothek“ skos:altLabel „DNB“
SKOS-XL: Modellierung des Schemas rdfs:range skosxl:prefLabel skosxl:Label rdfs:domain skosxl:Label skosxl:literalForm rdfs:range RDF Plain Literal rdfs:domain skosxl:Label skosxl:labelRelation rdfs:range skosxl:Label
SKOS-XL: Modellierung der Daten skosxl:literalForm skosxl:prefLabel _id1 „Frankfurt <Main> / Deutsche Bibliothek“ skosxl:altLabel id-4071342-8 _id2 skosxl:literalForm „Deutsche Nationalbibliothek“ skosxl:labelRelation _id3 skosxl:altLabel skosxl:literalForm „DNB“
SKOS-XL: Kompatibilität zu SKOS • Problem: • Woher weiß eine SKOS-Anwendung, dass z.B. skosxl:altLabel das gleiche ist wie skos:altLabel? • Lösung: Property Chaining in OWL 1.1 • (skosxl:altLabel, skosxl:literalForm) ist ein Unterproperty von skos:altLabel • Beispiel: Ableitung von skos:altLabel durch Reasoner skos:altLabel id-4071342-8 _id2 skosxl:altLabel skosxl:literalForm „Deutsche Nationalbibliothek“
Anwendungsfall • Darstellung der CrissCross-Relationen zwischen SWD und DDC im Linked Data-Service der DNB • Relationen in vier Determiniertheitsgraden: • DET 4: vollständige Übereinstimmung zwischen Schlagwort und DDC-Klasse • skos:exactMatch? • DET 3: wesentliche Übereinstimmung des Begriffsinhalts von Schlagwort und DDC-Klasse • skos:closeMatch? • DET 2: teilweise Übereinstimmung zwischen Schlagwort und einer umfangreicheren DDC-Klasse • skos:broadMatch? • DET 1: geringe Übereinstimmung zwischen Schlagwort und DDC-Klasse • skos:relatedMatch?
Anwendungsfall – Problematisches Beispiel 5* Naturwissenschaften 6* Technik 63* Landwirtschaft 59* Tiere (Zoologie) DDC 598.5-598.9 Landvögel 636 Viehwirtschaft 598.71 Psittaciformes (Papageienvögel) 636. 68656 Nymphensittiche DET 2 bzw. DET 3 bzw. skos:closeMatch skos:broadMatch SWD Nymphensittich
Anwendungsfall – Lösungsvorschlag 598.71 Psittaciformes (Papageienvögel) DET 2 Nymphensittich CrissCross DET 3 636.68656 Nymphensittiche Nymphensittich broadMatch 598.71 Psittaciformes (Papageienvögel) 590 Tiere (Zoologie) Linked Data Nymphensittich closeMatch 636.68656 Nymphensittiche 630 Landwirtschaft • Schlagwort im Kontext einer bestimmten Sachgruppe auf die entsprechende DDC-Klasse mappen
Koordinierte Konzepte – Modellierung des Schemas skos:Concept skos:broader rdfs:subClassOf rdfs:subPropertyOf Koordinierte Konzepte dnb:CoordinatedConcept dnb:coordination-of skos:closeMatch skos:exactMatch CrissCross-Relationen rdfs:subPropertyOf rdfs:subPropertyOf … dnb:DET3Match dnb:DET4Match
Koordinierte Konzepte – Modellierung der Daten skos:prefLabel id-4042855-2 „Nymphensittich“ skos:prefLabel sg-630 „Landwirtschaft“ skos:prefLabel ddc-636.68656 „Nymphensittiche“ dnb:CoordinatedConcept rdf:type dnb:DET3Match _id1 ddc-636.68656 dnb:coordination-of dnb:coordination-of id-4042855-2 sg-630
Koordinierte Konzepte – Kompatibilität zu SKOS (I) SWD DDC Begriffsebene Tierphotographie closeMatch 778.932 Tiere – Photographie 770 Fotografie Guido Mocafico, Schlangen Sachgruppe: 770SW-Kette: Mocafico, Guido/ Tierphotographie/ Schlangen Notation: 779. 32796092 Synthese: 77*.* Fotografie 779.* Fotografien 779.32* einzelner Tiere 779.32796* von Schlangen Titelbestand • Problem: Werden koordinierte Konzepte durch SKOS-Anwendungen richtig interpretiert? • Beispiel: Retrieval eines Buches mit SWD bzw. DDC
Koordinierte Konzepte – Kompatibilität zu SKOS (II) • SKOS-Anwendung muss skos:broader-Beziehungen zwischen koordinierten Konzepten ableiten können! Tierphotographie closeMatch 778.932 Tiere – Photographie 770 Fotografie skos:broader Muss automatisch abgeleitet werden!Voraussetzung: skos:broader wird interpretiert wie rdfs:subClassOf! Tierphotographie 770 Fotografie Mocafico, Guido Schlangen
Zusammenfassung Property-Chaining in OWL 1.1 Vererbung von bestehenden SKOS-Elementen • SKOS: Gemeinsames Schema zur Darstellung von Thesauri, Klassifikationssystemen etc. im Semantic Web • SKOS Erweiterungen: • Erweiterungen für das Thesaurs-Schema von SKOS • Wie werden Erweiterungen kompatibel gemacht zu bestehenden Anwendungen? Entwurfsmuster 1 Entwurfsmuster 2