1 / 9

Integration von Literaturdaten aus Open Data

Integration von Literaturdaten aus Open Data. Universitätsbibliothek Bochum. Ausgangssituation: Geringe Anzahl von Daten aus den Projektdatenbanken Ziel Anreicherung der vorhandenen Daten durch Integration offener bibliographischer Daten Derzeit

eden
Download Presentation

Integration von Literaturdaten aus Open Data

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum 27.06.2011 - Plenum UB Bochum

  2. Ausgangssituation: • Geringe Anzahl von Daten aus den Projektdatenbanken Ziel • Anreicherung der vorhandenen Daten durch Integration offener bibliographischer Daten Derzeit • Bearbeitung der Open Data aus der British National Library, British National Bibliography (Aufnahme aller in Großbritannien veröffentlichten Titel seit 1950)

  3. Offene bibliographische Daten der British National Library • Metadaten verfügbar in RDF/ XML • Problem: Verwendung verschiedenster Vokabulare: RDF, rdfs, DublinCore, skos, isbd, OWLT  keine direkte Konvertierung der Daten nach FRBR

  4. Vorgehen:Schritt 1 - Erstellen einer Konkordanz des vorliegenden Datenformates zu MODS

  5. Schritt 2 - Transformation der vorhandenen Datenformate in das MODS-FormatWeg:Erstellen eines XSLT-Stylesheets

  6. Schritt 3 - Auswahl archäologisch relevanter Titel • Insgesamt verfügbar: ca. 3 Millionen Titel (British National Bibliography) • Notwendig: Filtern der archäologisch relevanten Titel über Schlagwörter und Klassifizierungen • Verschlagwortung der BNB: Library of Congress Subject Headings, freie Schlagworte • Klassifizierung der BNB: Dewey Decimal Classification System • Filtern über DDC-Klasse 930 und ihre Unterklassen

  7. Relevante DDC-Klassen 930 History of ancient world to ca. 499 (umfasst auch alles Archäologische) 931 China to 420 932 Egypt to 640 933 Palestine to 70 934 India to 647 935 Mesopotamia & Iranian Plateau to 637 936 Europe north & west of Italy to ca. 499 937 Italy & adjacent territories to 476 938 Greece to 323 939 Other parts of ancient world to ca. 640  Erfassung von rund 4000 Titeln

  8. Ausblick • Ähnliches Vorgehen bei weiteren offenen Daten: • Library of Congress (Stand 2007, heute > 14 Millionen Titel) • Universitätsbibliothek Tübingen (> 2,6 Mio. Titeldatensätze plus verknüpfte Lokal- und Normdaten, Stand 19.05.2010) • Universitäts- und Stadtbibliothek Köln (ca. 3,1 Millionen Titelaufnahmen, allnächtliche Aktualisierung ) • Open Library • Eventuell Europeana (aktuelle Freigabe der Daten, 3,5 Millionen Texte, Bilder) • Arbeitsaufwand: variiert je nach Metadatenformat der jeweils verfügbaren Daten und nach der Art der Verschlagwortung/Klassifizierung

More Related