160 likes | 276 Views
IT-Zertifikat der Phil.Fak. Kurs 4: Daten- und Metadatenstandards. Patrick Sahle DC / OAI WS 08/09. Hausaufgaben der letzten Stunde Probleme und Lösungen Meine Lösung. Dublin Core (DC) Einstieg: http://de.wikipedia.org/wiki/Dublin_Core
E N D
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle DC / OAI WS 08/09
Hausaufgaben der letzten Stunde • Probleme und Lösungen • Meine Lösung
Dublin Core (DC) • Einstieg: • http://de.wikipedia.org/wiki/Dublin_Core • http://en.wikipedia.org/wiki/Dublin_Core (besser!) • http://dublincore.org/ • Organisatorischer, historischer und konzeptioneller Hintergrund
Dublin Core • einfacher Satz an Elementen/Begriffen zur Beschreibung von Objekten auf der Metadatenebene • core elements, version 1.1, ISO 15836 (2003): • http://dublincore.org/documents/dces/ • identifier • format, type, language • title, subject, coverage, description • creator, publisher, contributor, rights, provenance • relation, source • date
Dublin Core • "Dublin Core Simple" (15 Elemente) vs. • "Dublin Core Qualified" (element refinements) • "Begriffe im Namensraum DCTerms" (55 Elemente):http://dublincore.org/documents/dcmi-terms/
Dublin Core • … definiert Begriffe / Konzepte, keine Syntax • … kann ausgedrückt werden z.B. mittels HTML oder XML <head> <meta name="DC.title" content="DC Einführung"/> <meta name="DC.creator" content="Patrick Sahle"/> <meta name="DCTERMS,created" content="2009-01-20" /> <metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" /> <dc:title>DC Einführung</dc:title> <dc:creator>Patrick Sahle</dc:creator> <dcterms:created>2009-01-20</dcterms:created>
Dublin Core • Anwendungsbeispiel: OPAL • http://www.opal-niedersachsen.de/
Dublin Core - Anwendungsbeispiel: OPAL – Interne Datensicht (gekürzt) <?xml version="1.0" encoding="UTF-8" standalone="no"?><!DOCTYPE opalcollection PUBLIC "opal.dtd" "http://opal-niedersachsen.de/opal.dtd"><opalcollection> <record> <dc.identifier.opal>kunsdeung_niedge_94</dc.identifier.opal> <dc.identifier type="cat-no">112</dc.identifier> <dc.creator>Vliegher, Simon de (um 1600-1653)</dc.creator> <dc.creator type="alternative">De Vliegher, Simon</dc.creator> <dc.creator type="alternative"></dc.creator> <dc.title>Vliegher, Simon de (um 1600-1653): Christus und die Jünger im Seesturm</dc.title> <dc.format.extent>84,5 x 101 cm</dc.format.extent> <dc.format.extent type="size">84,5 x 101 cm</dc.format.extent> <dc.format.material>Holz</dc.format.material> <dc.type.opal>Gemälde</dc.type.opal> <dc.type type="MIME">image/jpeg</dc.type> <dc.description label="Beschreibung" type="abstract">Holz, 84,5 x 101 cm. - Bezeichnet links unten auf einer schwimmenden Tonne: S/DE/VLIEGER/1637. Auf der Rückseite eine Brandmarke: /£ […]</dc.description> <dc.description label="Kommentar">Dieses frühe Werk de Vlieghers zählt zu seinen seltenen biblischen Historien. […] </dc.description> <dc.relation.isReferencedBy type="bibliographic">G. Hoet, Catalogus of Naamlijst van Schilderijen, met derzelven Prijzen. 's-Gravenhage 1752, Bd. 2, S. 390, Nr. 24. […]</dc.relation.isReferencedBy> <dc.relation.image url="http://www.opal-niedersachsen.de/content/kunsdeung_niedge_94/000001.jpg" download="yes" use="hide">Foto</dc.relation.image> <dc.publisher.digital>Kunstsammlung der Universität Göttingen</dc.publisher.digital> <dc.date.digital>2005</dc.date.digital> <dc.identifier.collection>kunsdeung_niedge</dc.identifier.collection> <dc.relation.isPartOfCollection>Niederländische Gemälde aus der Kunstsammlung der Universität Göttingen</dc.relation.isPartOfCollection> <opal.isLocatedAt>Göttingen</opal.isLocatedAt> <dc.rights type="image">Kunstsammlung der Universität Göttingen</dc.rights> <dc.rights type="metadata">Texte: Dr. Gerd Unverfehrt, Fotos: Kunstsammlung der Universität Göttingen</dc.rights> </record>
Dublin Core • Anwendungsbeispiel: OPAL • myOpal xmlDownload ein Beispiel • Was ist hier los? Ist das noch Dublin Core? • Lokale Anwendung! Dokumentation über "Application Profile" • Bei Bedarf leicht übersetzbar auf Standard-"Dublin Core" (simple oder qualified)
OAI = Open Archives Initiative (eigentlich: OAI-PMH = Protocol for Metadata Harvesting)
OAI • Einstieg: • http://de.wikipedia.org/wiki/Open_Archives_Initiative • http://en.wikipedia.org/wiki/Open_Archives_Initiative • http://www.openarchives.org/ • http://www.openarchives.org/OAI/openarchivesprotocol.html • Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet • Wichtige Begriffe / Konzepte: Data-Provider, Service-Provider
OAI • Datenkommunikation über http-Request • Basisadresse + Script + Verb (+ Argument)? • Sechs "Verben" zur Kommunikation • Identify [wer bist du?] • ListMetadataFormats [was sprichst du?] • ListSets [was hast du für Sammlungen?] • ListIdentifiers [gib mir deine Identifier] • ListRecords [gib mir Datensätze] • GetRecords [gib mir Datensätze] • Sechs "Argumente": metadataPrefix, identifier, from, until, set, resumptionToken
OAI • Beispielanwendungen • OAISTER (Service Provider): http://www.oaister.org/ • ZVDD (Data Provider): http://www.digitalisiertedrucke.de/ • http://www.digitalisiertedrucke.de/oai2d.py?verb=ListSets • BSB (Data Provider): http://www.bsb-muenchen.de/ • http://mdz1.bib-bvb.de/~db/OAI/oai2.php?verb=Identify • CEEC (Data Provider): http://www.ceec.uni-koeln.de/ • http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=Identify • Spielen Sie mit diesen Schnittstellen! Teilweise können Sie einfach die Links benutzen (und dann die Adressen studieren). Bei CEEC müssten Sie selbst den Request formulieren (die URL zusammenbauen)
OAI • Beispielanwendung CEEC • Handschrift Dom 213 • Bild: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/pagesma/%22kn28-0213_001.jpg%22/segment/%22body%22 • Beschreibung: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/katl/%22kn28-0213%22 • XML (TEI-like): http://www.ceec.uni-koeln.de/projekte/CEEC/database/descriptions/kn28-0213.xml • OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn28-0213
DC revisited • Vor und Nachteile? • Lob der Einfachheit! Fluch der Einfachheit! • Informationsreduktion? (Strategien dagegen?) • Gebunden an Perspektiven und Wissensbereiche • Was ist das Objekt? • Granularität, Seitenbezug • Typ, Ontologischer Status • [Beispiel: was ist das "Datum" eines digitalisierten Objekts? Ist das digitale Bild eines Textes ein Bild oder ein Text? Ist Kermit ein Frosch oder eine Puppe?]