260 likes | 421 Views
EAD(DDB) in der Praxis. Die Verwendung in der DDB und im Archivportal-D. Umsetzung. Objektseiten Suchfilter Normdaten Verlinkung und Binärcontent Identifier Ingestprozess Ausblick. Objektseiten. Unterschiedliche Anzeige je Verzeichnungsstufe Archivportal-D Objektseiten analog zur DDB.
E N D
EAD(DDB) in der Praxis Die Verwendung in der DDB und im Archivportal-D
Umsetzung • Objektseiten • Suchfilter • Normdaten • Verlinkung und Binärcontent • Identifier • Ingestprozess • Ausblick
Objektseiten • Unterschiedliche Anzeige je Verzeichnungsstufe • Archivportal-D Objektseiten analog zur DDB
Hierarchien • Nicht alle Stufen haben eine Objektansicht
Strukturierung der Beschreibungen durch Absätze wichtig: Absätze im Freitext in </lb> umwandeln
Suchfilter • Zeit: ISO-8601 („YYYY-TT-MM“) • Bereinigungsprozess in der DDB • Sprache: ISO 639-2 („ger“) • Medientyp: fixes Vokabular • Sparte / Datenlieferant: aus der Registrierung befüllt • Person / Ort / Stichwort: • Indexbegriffe • + Urheber/Provenienz und Archivalientyp • Archivalientyp-Vokabular sollte normalisiert angegeben werden • sinnvoll Einträge doppelt anzugeben
Verlinkung und Binärcontent • Links • zurück ins Findmittelsystem • zu einem Viewer • zum Findbuch • Binärcontent • Link zum „freistehenden“ Digitalisat • Direkte Mitlieferung der Digitalisate - Angabe der relativen Pfade
Personen-Seite Normdaten Wikipedia GND • GND: Zentrales Element zur Vernetzung der Inhalte • Entitätenseiten als zusätzlicher Einstieg • Anreicherung mit externen Inhalten • Möglich Normdaten anzugeben für Indexbegriffe, Provenienz und Urheber GND DDB
Stabile Identifier DDB interner Identifier baut auf IDs aus EAD(DDB) auf Zum Überschreiben alter Datensätze bei Neulieferungen Um Verlinkung zwischen Tektonik und Findbuch zu gewährleisten Zum Abgleich der Datenlieferung bei verschiedenen Lieferwegen Stabile Objektreferenz in myDDB Grundlage für Persistent Identifier Systeme
Anforderungen Nicht sprechende technische Identifikatoren Eindeutigkeit (Findbuch und Tektonik) innerhalb der Institution zentral (nicht nur innerhalb der Datei) Auch für Gliederungsstufen und Binärcontent Wird nicht erst beim Export erzeugt Stabilität bei Neulieferungen muss gewährleistet sein Muss auch bei einem Software-Umstieg stabil bleiben Im besten Falle beruhen auch die Links auf den Identifiern (Permalink-System)
Umsetzungsbeispiele • LABW: aid: zusammengesetzt aus einem Archividentifier und der scope-id (eindeutige ID in scope für jeden Datensatz) • Beispiel: 1-2951896 • LAV: weltweit eindeutige Identifier (UUIDs/GUIDs) werden pro Verzeichnisebene vergeben • Beispiel: 936DA01F-9ABD-4D9D-80C7-02AF85C822A8
Ingestprozess Datenlieferanten schicken Testdaten Kontrolle anhand des Schemas Laden in ein Testsystem (inhaltliche Kontrolle) Im Moment: Anpassungen vor dem Ingest von der Fachstelle Archiv zukünftig standardisiertes EAD(DDB) von zentraler Bedeutung Plan 2014: Fachstelle Archiv: Standardisierung der Export-Schnittstellen
Ausblick METS: Nutzen eines gemeinsamen Viewers Spezifischere Rechteauszeichnung je Digitalisat Persistent Identifier-Systeme: stabile Links in der DDB Rollen: spezifischere Auszeichnung der Personen Geo-Koordinaten: Kartenanwendungen OAI-PMH: Protocol for Metadata Harvesting
Valides EAD(DDB) Die Schemata
Valides EAD(DDB) • Änderungen in EAD 1.1 • Dokumentation • Zweck der Schemata • Schemata • Normiertes Vokabular • Mögliche Probleme bei der Validierung • Anforderungen an die Exportschnittstellen
EAD(DDB) 1.1 • Geringe Erweiterungen • Einfachere Unterscheidung zwischen Findbuch und Tektonik Datei • Angaben zum Archiv und zur Überorganisation besser getrennt • Mehr Möglichkeiten zur Einbindung von Normdaten • In der Format-Definition in Excel ausgezeichnet • rot: Änderungen • grün: Ergänzungen
Dokumentation • Jeweils pro Tektonik und Findbuch-Datei • Beschreibende Informationen in Word: erläuternde Informationen • Dokumentation in Excel-Form • Überblick über Struktur von EAD(DDB) und den Verpflichtungsgrad der Elemente • Testdateien in einer minimalen und maximalen Ausprägung • Schemata • Verfügbar unter http://www.landesarchiv-bw.de/ead (Version 1.1)
Zweck der Schemata • EAD 2002 ermöglicht eine sehr breite Verwendung aller Elemente Reduktion der Möglichkeiten • Hilfestellung bei der Erstellung von Schnittstellen • Kontrollfunktion beim Import • Weiterlieferung an das Archivportal Europa mit einem Mapping ermöglichen
Schemata Unterscheidung zwischen Tektonik- und Findbuch-Schema Zwei Versionen: XSD 1.1 (Referenzversion) XSD 1.0 (für ältere XML-Software ungenauer) kein Zusammenhang mit EAD(DDB) 1.0! Kein dtd vorgesehen! Sehr eng gehalten, um Abweichungen möglichst schnell zu entdecken Basiert auf großem EAD: EAD(DDB) ist valide zu EAD EAD(DDB) 1.1 Validierung möglich mit dem DPT von APEx
Kontrollierte Vokabulare • Bundesland (offizielle Bezeichnungen) • Archivtyp (VDA-Fachgruppen) • Medientyp (TEXT, BILD, AUDIO, VIDEO) • Archivalientyp: normiertes Vokabular • Datum: ISO-8601 • ISIL: z.B.: DE-1951 • @xlink:role: für Linktyp/Digitalisatstyp 21
Mögliche Validierungsprobleme 1 Richtigen Namespace verwenden ead-namespace muss ausgezeichnet sein! Die Reihenfolge der Elemente ist in vielen Abschnitten von EAD zentral bedingt durch das große EAD Schema Manche Elemente dürfen nicht ohne Unterelemente erzeugt werden Elemente und Attribute sollen nur dort erlaubt sein, wo dies vorgesehen ist Einfache Kontrolle, ob das Mapping richtig ist Elemente sollen je nach Definition im oder nicht im Gruppierungselement (<did>) verwendet werden
Mögliche Validierungsprobleme 2 • Header / Angaben zum Archiv • Keine c01-c12 Elemente sonder nur c-Elemente • Es sollen keine Überschriften (<head>) ohne Inhalt (<p>) erzeugt werden • Die IDs sollten der Ansetzung von XML-IDs entsprechen • z.B.: dürfen nicht mit Namen anfangen, dürfen nicht leer sein • Das normalisierte Datumsfeld sollte ISO-8601 konform sei, soweit dies gewährleistet werden kann
Anforderungen an die Schnittstellen • Nichtvalides EAD sollte vom Nutzer nicht erzeugt werden können • Basis EAD(DDB)-Export sollte ohne Konfiguration möglich sein
Notwendigkeiten • Stabile Identifier sind zentral! • Verknüpfung zwischen Findbuch und Tektonik muss gewährleistet sein! • Links zurück ins Findbuchsystem und auf „freistehende“ Digitalisate sollen, so fern vorhanden, mitgeliefert werden
Vielen Dank für Ihre Aufmerksamkeit Fragen? Hinweise? Anregungen? Martin Reisacher Tel.: 0711/212-4298 Email: martin.reisacher@la-bw.de