310 likes | 394 Views
Management digitaler Sammlungen. Bettina Kann. 2. Treffen: „Sammlungen an der Universität Wien“ 30.11.2007 bettina.kann@onb.ac.at www.onb.ac.at/about/lza. Überblick. Was ist eine „digitale Sammlung“? Sammelrichtlinien Metadaten Langzeitarchivierung Dokumentenserver / Digitales Archiv
E N D
Management digitaler Sammlungen Bettina Kann 2. Treffen: „Sammlungen an der Universität Wien“ 30.11.2007 bettina.kann@onb.ac.atwww.onb.ac.at/about/lza
Überblick • Was ist eine „digitale Sammlung“? • Sammelrichtlinien • Metadaten • Langzeitarchivierung • Dokumentenserver / Digitales Archiv • OAIS-Modell
Was ist eine „digitale Sammlung“ ? | 1 Aspekte: organisierte Sammlung digitaler Objekte bestehend aus z.B. digitalen Text-, Bild-, Ton-, Video- und Multimediaobjekten Die digitalen Objekte werden nach definierten Richtlinien erstellt (z.B. durch Digitalisierung) und/ oder gesammelt. Die (digitalen) Objekte werden nach Standards erschlossen Metadaten Die digitalen Objekte werden über digitale Services einheitlich zugänglich gemacht. Die digitalen Objekte werden langfristig bewahrt.
Was ist eine „digitale Sammlung“ ? | 2 Besteht aus 3 Kategorien digitaler Objekte: Digitales Originalobjekt Digitalisat - als Dokumentation zu Original - als Ersatz für (z.B. gefährdetes) Original (Bsp.: analoge Tonträger) - als Servicekopie mit Mehrwert Digitale Dokumentation: Metadaten Analoges Original + digitale Dokumentation alleine ist keine digitale Sammlung!
Management digitaler Sammlungen Wie bei analogen Sammlungen Sammeln Sammelrichtlinien Erschließen Metadaten Bewahren Langzeitarchivierung Zugänglichmachen Services
Sammelrichtlinien | 1 Typen digitaler Objekte Eprints: Pre-Prints, Post-Prints, Aufsätze, Working Papers, Monographien und Reihen, Tagungsbände,Newsletter und Mitteilungsblätter, Forschungsberichte, Vorlesungsmanuskripte, Retrodigitalisierte Texte Elektronische Hochschulschriften Elektronische Publikationen: Elektronische Zeitschriften,E-Books E-Learning-Materialien Wissenschaftliche Primärdaten: Daten aus Experimenten (z.B. physikalische Versuchreihen), Beobachtungen (z.B. Klima-Daten), statistischen Untersuchungen (z.B. soziologische Erhebungen) usw GIS Digitale Kunst Digitalisate: Bilder, Text, Audio, Video Internet Software
Sammelrichtlinien | 2 Aufgrund der Vielzahl an digitalen Objekten MUSS eine Auswahl getroffen werden! Sammelpolitik ergibt sich aus: • Allgemeine Strategie der Institution • Bereits bestehender (analoger) Sammlung • Zielgruppe • Ressourcen (personelle und budgetäre) • zusätzlich bei digitalen Objekten: aus technischer Machbarkeit
Metadaten | 1 • grundlegender Bestandteil digitaler Sammlungen • Ermöglichen Beschreibung, Organisation, Austausch und Gewinnung von Information • Einfachste Definition von Metadaten: „Daten über Daten“ • „neuer“ Begriff, aber „altes“ Konzept Kataloge in Bibliotheken, Findbücher in Archiven, Inventare in Museen ...
Metadaten | 2 • ermöglichen die Beschreibung von Objekten: Vgl. traditionelle Katalogisierung, formale Beschreibung, Beschlagwortung, Erstellung von Indizes, Verwendung von kontrollierten Vokabularen, Thesauri, Normdaten etc. • bieten Sucheinstiege für Benutzer • verzeichnen die „Geschichte“ digitaler Objekte („Information Lifecycle“): – Autorschaft – Herkunft – Änderungen – Nutzung – Verwaltung von Rechten
Metadaten | 3 • Sicherstellung der Authentizität digitaler Objekte: (Prüfsummen, digitale Signaturen etc.) • Eindeutige und persistente Identifizierung von digitalen Objekten (Beispiele: DOI, URN, PURL) • Sicherung der langfristigen Verfügbarkeit digitaler Objekte – Langfristige Archivierung erfordert Metadaten, die die physischen Charakteristiken der Objekte beschreiben (technische Eigenschaften, erforderliche technische Umgebung etc.) – Dokumentation des Verhaltens digitaler Objekte („Was muss erhalten bleiben?“) – Dokumentation der Veränderungen an digitalen Objekten (z.B. bei Formatmigrationen)
Metadaten | 4: Typen von Metadaten Strukturelle Metadaten:Geben an, wie mehrteilige Objekte zusammenhängen (z.B. Seiten bzw. Kapitel eines Buch), bzw. in welcher Beziehung Objekte zueinander stehen Deskriptive Metadaten Administrative Metadaten: Rechtliche Metadaten Technische MetadatenMetadaten zur LangzeitarchivierungMetadaten zur Geschichte des Objekts („Object History Metadata“)Identifikatoren
Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) http://www.openarchives.org/ OAI-PMH ermöglicht effizienten Austausch von Metadaten Minimalstandard für Metadaten: Dublin Core Austausch von beliebigen Metadaten möglich, sofern sie über ein XML-Schema definiert sind Interoperabilität - Transferschnittstellen
Zunehmend ausschließlich digital produziert, verbreitet, genutzt („born digital“, Aufsätze, Working Papers, Conference Proceedings, Projektberichte, …) Digitalisierung analoger Ressourcen Bessere Zugänglichkeit Dokumentation analoger Bestände Erhaltung fragiler Dokumente (z.B. Audio- und Videodokumente auf instabilen Datenträgern) Komplexe Herauforderung für Gedächtnisinstitutionen: Sicherung dieses „digitalen Erbes“ für die Zukunft Langzeitarchivierung | 1: WOZU?
Strategien zur Langzeitarchivierung stellen sicher, dass eine integre und authentische Version einer digitaler Ressource auch mit zukünftigen technischen Umgebungen zugänglich und benutzbar ist. Backup Migration (Umkopieren und Formatkonvertierung) Emulation Langzeitarchivierung | 2
Herausforderung: Vielfalt der Formate (Text, Bild, Audio, Video, Multimedia, Datenbanken, Websites ...) Vielfalt der Transferwege ( unterschiedliche Workflows) Vielfalt der benötigten Hard- und Software Ergibt in Summe Viele unterschiedliche Migrations- und Konversionsverfahren bei Langzeitarchivierung (evtl. plus Emulation) Langzeitarchivierung | 3
Versorgung meiner Zielgruppe mit aktuellen Medien Dokumentenserver Prämisse: Dokumente dürfen „verloren“ gehen! Mindestens jedoch 5 Jahre verfügbar. Langfristige Bewahrung für zukünftige Generationen Digitales Archiv, digital repository Prämisse: Dokumente müssen erhalten werden! Variante: Dokumente aus Dokumentenservern werden von einer oder mehreren Institutionen, die ein digitales Archiv betreiben, zur langfristigen Erhaltung übernommen. Dokumentenserver oder Digitales Archiv ?
[Institutionelle] Dokumentenserver | 1 • Service meist für Mitglieder der eigenen Institution • Meist freier Zugang zu den Dokumenten, Unterstützung der Open Access Bewegung (Zugangsbeschränkungen mgl.) • Tw. Beschränkungen bezüglicher akzeptierter Dokumenttypen, Formate etc. • OAI-Funktionalität (Metadata Harvesting) • „Best Practices“ erst im Entstehen • Fokus zunächst auf Technologie erst in jüngster Zeit treten Fragen wie Planung, Langzeitarchivierung etc. in den Vordergrund • Tw. OAIS-konform Gute Ressource über Dokumentenserver:SHERPA: http://www.sherpa.ac.uk Guidance
[Institutionelle] Dokumentenserver | 2 Distribuiert: • z.B. Massachusetts Institute of Technology (MIT) • Wissenschaftler stellen selbst ihre Materialen in das Systeme (E-Prints, Lernmaterialien, Multimediaobjekte etc.) Semi-Distribuiert: • Z.B. University of California • Verantwortung liegt bei Organisationseinheiten (z.B. Institute), die das Personal beim Upload unterstützt Semi-Zentralistisch • Z.B. California Institute of Technology • Institute verantwortlich, aber Upload durch die Bibliothek
[Institutionelle] Dokumentenserver | 3 DINI-Zertifikat für Dokumentenserver: http://www.dini.de/documents/Zertifikat.pdf Kriterien für DINI-Zertifikat: • Leitlinien (Policy) • Autorenbetreuung • Rechtliche Aspekte • Authentizität und Integrität • Erschließung • Zugriffsstatistik • Langzeitverfügbarkeit
Vertrauenswürdige Digitale Archive Trusted Digital Repositories. Attributes and Responsibilities (Mai 2002), http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf • Konformität mit dem OAIS-Standard • Administrative Verantwortlichkeit • Gesicherte organisatorische Struktur und sichererrechtlicher Status • Finanzielle Nachhaltigkeit • Technologische und verfahrenstechnische Eignung • Gewährleistung von Daten- und Systemsicherheit • Überprüfbare prozedurale Verantwortlichkeit
OAIS | 1 OPEN ARCHIVAL INFORMATION SYSTEM • Referenzmodell für Digitale Archive • Generisches Modell für die Organisationeines digitalen Archivs • Über 50 Komponenten und Prozesse • Terminologie für digitale Objekte und die mit ihnen assoziiertenMetadaten • 1995–2002 vom Consultative Committee for Space Data Systems (CCSDS) entwickelt • CCSDS 650.0-B-1: Reference Model for an Open Archival Information System (OAIS). Blue Book. Issue 1. January 2002. – ISO 14721:2003, http://ssdoo.gsfc.nasa.gov/nost/isoas/ref_model.html • Einführung: Brian F. Lavoie: The Open Archival Information System Reference Model: Introductory Guide, 2004http://www.dpconline.org/docs/lavoie_OAIS.pdf
OAIS | 2 • Rahmen für grundlegendes Verständnis der für digitale Langezeitarchivierung erforderlichen Konzepte • Rahmen zum Vergleich von Architekturen und Funktionalitäten von Archivsystemen • Basis für die Entwicklung von zusätzlichen Standards • Beinhaltet umfassende Zusammenstellung von Archivfunktionen • Anwendbar für alle Archive, (Digitale) Bibliotheken etc. • Spezifiziert KEINE konkrete Implementierung!
OAIS | 3 „Open“ bezieht sich auf offenen Prozess, in dem der Standard entwickelt wurde „Archival Information System“: Definiert als: „Organisation von Menschen und Systemen, die verantwortlich ist für die Erhaltung von Information über lange Zeiträume und die Bereitstellung dieser Information für eine bestimmte Nutzergemeinschaft“
Producer: Personen, Institutionen oder Systeme, die die zu bewahrende Information zur Verfügung stellen Informationsobjekte werden über einen definierten „Ingest Process“ (=Datenaufnahme) in das Archiv aufgenommen Interaktion meist durch ein „Submission Agreeement“ geregelt (Archivierungs- und Benutzungsvereinbarung) Management: Rolle der Personen, die für die generellen OAIS-Strategien und -Richtlinien verantwortlich sind Consumer: Personen, Institutionen oder Systeme, die mit den OAIS-Services interagieren, um Information zu finden und zu nutzen „Designated Community“ („Nutzergemeinschaft“) OAIS | 4: Umwelt OAIS (Archive) Consumer Producer Management
OAIS | 5: Funktionales Modell OAIS Preservation Planning P R O D U C E R C O N S U M E R Data Management Descr. Info queries result sets SIP Ingest Access orders Archival Storage DIP AIP Administration SIP = Submission Information Package AIP = Archival Information Package DIP = Dissemination Information Package MANAGEMENT
OAIS | 6: Funktionales Modell Ingest Prozesse und Funktionen, die mit der Aufnahme von Informationsobjekten in das Archiv verbunden sind: Interface zwischen Institution und Datenproduzent: „Erwerbung“ Archival Storage Prozesse und Funktionen zur langfristigen Speicherung von Informationsobjekten im Archiv
OAIS | 7: Funktionales Modell Data Management Verwaltung der Metadaten zur Identifizierung und Beschreibung der archivierten Information Verwaltung der administrativen Daten des OAIS (z.B. Zugriffstatistiken) Prozesse: • Verwaltung der Datenbank • Datenbankabfragen • Erzeugung von(statistischen)Reports • Aktualisierungder Datenbank
OAIS | 8: Funktionales Modell Access Verwaltung der Prozesse und Services, durch die Benutzer Informationsobjekte finden, anfordern und benutzen können – OAIS-Interface mit Konsumenten Prozesse: • Durchführung von Datenbankanfragen • Koordination der Zugriffsprozesse • Zugriffskontrolle • Präsentation derSuchergebnisse • Bereitstellung des„DisseminationInformation Package“
OAIS | 9: Informationsmodell Generalisierte Beschreibung der Informationsobjekte, die in einem OAIS verwaltet werden • Konzept des „Information Package“ • Konzeptualisierung der Struktur wie Information in dasArchiv, durch das Archiv und aus dem Archiv fließt • Information Package besteht aus einem „Paket“ aus dem zuarchivierenden digitalen Objekt PLUS den Metadaten, diefür die Langzeitarchivierung und die Bereitstellungerforderlich sind • Modell unterscheidet drei unterschiedliche InformationPackages
OAIS | 10: Informationsmodell Producer Submission Information Package OAIS Archival Information Package query result set order Consumer Dissemination Information Package
OAIS | 11: Informationsmodell 1. Submission Information Package (SIP) –vom Produzenten in das OAIStransferierte Dateninformation –häufig entsprechend einer Vereinbarungzwischen Produzent und OAIS –nicht notwendigerweise bereits archivierbare Struktur und komplette Metadaten 2. Archival Information Package (AIP) – langfristig archivierte Version des Information Package(z.B. nach Migration in ein Archivformat) –komplette Metadaten 3.Dissemination Information Package (DIP) – dem Benutzer zur Verfügung gestellte Version (z.B. AIP = TIFF-Image, DIP = JPEG-Image) –in Formund Metataten vom AIP eventuell verschieden