320 likes | 445 Views
1. Reinhard Altenhöner. Kollaboration durch das Semantic Web: Strategie und Aktivitäten der Deutschen Nationalbibliothek SWIB 2010 Köln, 29.11.2010 mit herzlichem Dank an die Kollegen A.Haffner, S. Hartmann, J.Hannemann, J.Hauser, J.Kett, L.Svensson. 2. ToC. Ausgangspunkt und Motivation
E N D
1 Reinhard Altenhöner Kollaboration durch das Semantic Web: Strategie und Aktivitäten der Deutschen NationalbibliothekSWIB 2010Köln, 29.11.2010mit herzlichem Dank an die Kollegen A.Haffner, S. Hartmann, J.Hannemann, J.Hauser, J.Kett, L.Svensson
2 ToC • Ausgangspunkt und Motivation • Aktivitäten und Ziele • Weitere Planungen / Entwicklung • Zusammenfassung / Perspektiven | Reinhard Altenhöner|SWIB 2010 | 29.11.2010
3 1. Ausgangspunkt(e) und Motivation | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
4 Punkt 1: (Norm)datenPersonen, Körperschaften, Sachschlagwörter = Gemeinsame Normdatei GND DDC PND SWD GKD | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
5 Beispiel: | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
6 Die Innensicht: PICA+ | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
7 Punkt 2Linked Open Data: Die Prinzipien • Use URIs (Unique Ressource Identifiers) as names for things • Use HTTP URIs so that people can look up and reference those things. • When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) • Include links to other, related URIs, so that users can discover more things (Tim Berners-Lee, 2007) | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
8 Linked Data: Das Konzept • Ein Verfahren zum • Veröffentlichen, • Austauschen • und Verknüpfen von Daten im World Wide Web • Einfaches und praxisorientiertes Grundprinzip (kein „Standard“, sondern Best-Practices) • Bedingungen: • Zitierbarkeit und Transparenz • Persistenz von Daten und Ressourcen • Nützlich: Sichtbarkeit der Urheberschaft von Daten, Änderungshistorie • Global vernetzt: domänenübergreifend (Recherche, Entstehung und Anreicherung von Daten) | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
9 Zusammenfassung: Ausgangslage Positiv: • Gut gepflegte, relevante Datenbestände Mangelware: • Interoperabilität der Daten • Datentausch • Kooperative Datenpflege • Integrierte, übergreifende Dienstleistungen • Präsenz im WWW Biblio-theken Verlage Museen Archive ... ... ... ... | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
10 Lösungsansatz „Linked Data“ Biblio-theken Verlage Museen Archive ... ... ... ... Weltweite Datenbank aus vernetzten Daten | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
11 Linked Data heute: Bibliotheksdaten sind drin | 28 | Normdateien als Linked Data | 23. September 2010
12 2. Aktivitäten und Ziele | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
13 Unsere Vision: Global Cultural Graph • Bibliotheken, Museen und Archive sind integraler Bestandteil des Semantic Web • Sie geben ihm die nötige Verlässlichkeit und Stabilität • Sie sind Stützen für das Netz der Kultur und der Wissenschaft | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Linked Data Service Projekt „Linked Data“ (10/2009 – 05/2010): Inbetriebnahme eines Beta-Services Erster Kontakt mit der Semantic-Web-Community Erfahrungsaustausch mit den Nutzern Projekt „Linked Data 2“ (07/2010 – 12/2010) Bessere Skalierbarkeit Neue Datasets, mehr Verlinkung Suchschnittstellen LD als vollwertiger Dienst 14 | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
15 Linked Data. Vorläufige Erkenntnisse • Datenmodellierung ist komplex • Etablierte Ontologien bilden unsere Daten nicht vollständig ab • Verwendung von geeigneten Teilen • Ergänzung um spezielle Properties, aber: Risiko • Modellierung in RDA, SKOS, etc. | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
16 http://marccodes.heroku.com/languages/ger “1966” “1877“ rdaGr2:languageOfThePerson http://dbpedia.org/resource/Hermann_Hesse rdaGr2:dateOfBirth rdaGr2:dateOfDeath Für Körperschaften und Personen: Mischung aus RDA und eigenem Vokabular owl:sameAs http://d-nb.info/gnd/11855042X rdaRelGr2:relatedPersonPerson gnd:preferredNameForThePerson http://d-nb.info/gnd/118609920 gnd:foreName gnd:usedRules rdaGr2:gender gnd:surname http:// RDVocab.info/termList/gender/1002 “RAK-WB“ “Hesse“ “Hermann“ | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
17 SWD und DDC mit SKOS „Nymphensittich“@de „Nymphicus hollandicus“@lat skos:Concept rdfs:type skos:prefLabel skos:altLabel http://d-nb.info/gnd/4042855-2 rdfs:subclassOf dnb:coordination-of skos:broader dnb:CoordinatedConcept rdfs:type http://d-nb.info/gnd/4239774-1 dnb:det2match dnb-ddc: 598.71 dnb:coordination-of skos:altLabel skos:prefLabel dnb-sg:590 Normdatei Authority file | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
18 Verlinkungen zu LCSH, Rameau, VIAF und DBPedia LCSH VIAF DNB Rameau DBPedia | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
19 Aktueller Stand: LD Daten | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
20 Aktueller Stand: Einbindung ins Portal | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
21 Aktueller Stand: Technik SPARQL (HTTP-Binding) Apache Tomcat Jena API Index Joseki TDB read TDB File Conversion Tools read/write TDB CBS RdfExporter Jena API | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
22 Aktueller Stand: Nachnutzung (Beispiele) • TU Braunschweig: Durchsuchbare Datenbank der Normdaten mit Webinterface • „Pressemappe 20. Jahrhundert“ der ZBW • Museumsverband: Anreicherung einer Website für Museumsstück • Rückführung unserer MACS-Mappings nach RAMEAU (und verm. LCSH) • Erfahrungsaustausch mit verschiedenen Bibliotheken und Institutionen | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
23 Nachnutzung: Beispiele | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
24 Aktivitäten der DNB im Überblick – nächste Schritte | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
25 CG | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Semi- automatic semantic linking Automatic quality analysis & optimization Automatic content context analysis Related books Year of printing, editions, authors, summary of the book…. Related music score Year of printing, editions, authors, summary of the book…. Related internet links Year of printing, editions, authors, summary of the book…. Related songs Year of printing, editions, authors, summary of the book…. Related films Year of printing, editions, authors, summary of the book…. Related news Year of printing, editions, authors, summary of the book…. ? 26 Knowledge Base Face Open knowledge network Logo Multimedia search & access Film Information about actors, director, producers, music, sequence, year of production. Short description of the picture, video sequence… What is in the film, rights. Any other relevant information as short summary of content for fast access… & Digitization Text Person Voice, music… 5 4 6 1 2 3 Die Contentus-Prozesskette Manage, search, retrieve, reuse, … • Entity Recognition • Strukturerkennung / Sequenzanalysen • Interferenzen • Semantische Multimediasuche | Reinhard Altenhöner| SWIB 2010 | 29.11.2010 26
3. Weitere Planungen / Entwicklung 27 | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
28 Daten sind veröffentlicht.Und jetzt? WWW … HBZ-Titel PND Deutsches Filmarchiv DNB-Titel Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
29 Unverknüpfte Dubletten hunderte URIs für dieselbe Ressource Anbindung kleinerer Einrichtungen Suchmaschinen? Wirklich? Web-Suchmaschine … HBZ-Titel PND Deutsches Filmarchiv DNB-Titel Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
30 culturegraph.org WWW culturegraph.org … HBZ-Titel PND Deutsches Filmarchiv DNB-Titel Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
31 Zusammenfassung / Perspektiven • Linked Data ist der Quasistandard für Datenveröffentlichung und Datenaustausch im WWW • Es geht um Verlinkung und Interoperabilität • LD ist bereits domänen-übergreifend • Vertrauenswürdigkeit • Langfristig unverzichtbar: offene Lizenz! • Beschäftigung mit RDF / geeigneten Ontologien • Kooperation und Koordination | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Fragen? 32 | Reinhard Altenhöner| SWIB 2010 | 29.11.2010