250 likes | 437 Views
Pilotprojekt Digitale Langzeitarchivierung. Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008. Projektorganisation. Kooperation zwischen drei Partnern Informatikdienste der ETH Zürich ETH-Bibliothek
E N D
Pilotprojekt Digitale Langzeitarchivierung Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008
Projektorganisation • Kooperation zwischen drei Partnern • Informatikdienste der ETH Zürich • ETH-Bibliothek • Konsortium der Schweizer Hochschulbibliotheken • Phase 1: 01.09.2006 – 31.05.2007 • Phase 2: 01.06.2007 – ca. Ende 2008
Ausgangslage (1) • Digitale Informationen an der ETH Zürich • Aus der Forschung • Primärdaten: digitale Messdaten • Sekundärdaten: elektronische Auswertungen / Ergebnisse • Aus der Verwaltung • digitale Dokumente: Geschäftsdaten
Ausgangslage (2) • ETH-Bibliothek • verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc. • traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form) • An der ETH Zürich fehlt: ein umfassender Ansatz für die langfristige Archivierung und Verfügbarkeit von digitalen Primär- und Sekundärdaten
OAIS-Referenzmodell als Basis • ISO-Standard 14721 seit 2001 • Consultative Committee for Space Data Systems (CCSD) – NASA, ESA, DLR • Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig • Übernahme von Modulen in Projektorganisation und Strukturplan
Nutzung von Erfahrungen und Kompetenzen • Austausch international • E-Helvetica • kopal • KB – Koninklijke Bibliotheek der Niederlande • Kooperation mit nestor • Gemeinsame Umfrage 2007 • Nachnutzung: „Kriterienkatalog vertrauenswürdige digitale Langzeitarchive“
Testdaten (1) • Primärdaten • Departement Erdwissenschaften der ETH Zürich • Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes • Projekt Replay – Multimedia-Portal System der ETH Zürich • Video-Dateien (Vorlesungen)
Testdaten (2) • Sekundärdaten • ETH-Bibliothek und Konsortium • E-Journals Elsevier • E-Books (Springer) • E-Pics (Bildarchiv) • E-Collection (Dissertationen und elektronische Publikationen der ETH-Angehörigen
Metadatenanalyse (1) • Standards • Möglichst bestehende Standards und offene Formate verwenden • Für möglichst viele Objekttypen ohne Anpassungen • Metadatengewinnung • Möglichst automatisierter Ablauf
Metadatenanalyse (2) • Metadatenstandards • Geeignet für die Langzeitarchivierung
Definition von Preservation Levels (1) • Definition für die ETH Zürich • Drei Stufen und • Kriterien für die Langzeitarchivierung Preservation Level C • Dauerhafte Datenhaltung • mit umfassender Serviceleistung Preservation Level B Servicelevel • Mittelfristige Datenhaltung • mit geringer Serviceleistung Preservation Level A • Kurzeitige Datenhaltung • mit minimaler Serviceleistung Aufbewahrungsdauer
Kriterien – Preservation Levels (2) • Kriterien für die Archivierung nach den Preservation Levels
Übergabevereinbarung • Datenlieferant • Art und Umfang der Lieferung • Inhaltliche Umschreibung • Umfang, Dateiformate, Übergabeverfahren • IT-Umgebung, Metadaten etc. • Verpflichtung des digitalen LZA • Preservation Levels • Dauer der Archivierung u. Dienstleistungsumfang • Nutzungsbedingungen • Zielgruppen, Nutzungsrechte • Schutzfristen, Kosten • etc.
Online-Umfrage (1) • Bedarfsanalyse April 2007 • Klärung des Bedarfs an LZA digitaler Objekte an der ETH Zürich • Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen) • Adressaten • Alle 15 Departemente der ETH Zürich • Zentrale Dienste • Rücklauf: 20%
Online-Umfrage (2) • Allgemeine Aussagen • Über 80 % haben Interesse an einer zentralen Dienstleistung „digitale Langzeitarchivierung“
Online-Umfrage (3) • Vereinbarungen und Vorschriften • ca. 80 % geben an, dass es in ihrer Organisationseinheit keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.
Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist? Ja 48 (51%) Nein 29 (31%) keine Antwort 17 (18%) Online-Umfrage (4) • Formate der zu archivierenden Daten und Objekte • ASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB, NETCDF, PDF, TIF, TXT, WORD, XML • Teilweise proprietäre Formate
Online-Umfrage (5) • Aufbewahrungsdauer
Online-Umfrage (6) • Technische Metadaten • Daten und Objekte verfügen überwiegend über keine standardisierten Metadaten
Online-Umfrage (7) • Inhaltliche Metadaten • Rund die Hälfte der Antworten bejaht das Vorhandensein von inhaltlichen (deskriptiven und administrativen) Metadaten.
Online-Umfrage (8) • Format der technischen u. inhaltlichen Metadaten • 41 % antworten mit ja, aber nennen kein konkretes Format.
Online-Umfrage (9) • Aktuelle Massnahmen • eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum.
Schritt 1 Schritt 2 Anforderungs - Workshops katalog Lieferanten Auswahl der Software und Pilot • Ziel: Vergleichende Pilotinstallation • Vergleich zweier unterschiedlicher Ansätze Schritt 3 Schritt 4 Präsentationen Test- Lieferanten Installationen
Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung: E-Mail: pascalia.boutsiouci@library.ethz.ch / Telefon: +41 44 632 84 26