250 likes | 464 Views
WP3 UGent-Boekentoren UGent-MMLab. WP3. SOTA Gelaagd Metadata Model Survey To Do. SOTA. Doelstelling rapport: inzicht krijgen in … Structurele eisen voor beschrijving van digitale MM Gangbare bestandsformaten & compressieformaten voor opslag en uitwisseling van MM
E N D
WP3 UGent-Boekentoren UGent-MMLab
WP3 • SOTA • Gelaagd Metadata Model • Survey • To Do
SOTA • Doelstelling rapport: inzicht krijgen in … • Structurele eisen voor beschrijving van digitale MM • Gangbare bestandsformaten & compressieformaten voor opslag en uitwisseling van MM • Beschikbare metadatastandaarden per sector • Beschrijvend, technisch, … • Best-practices langetermijn bewaring MM • Nodige (meta) datamodel voor langetermijn bewaring
SOTA • Problemen met archivering van digitale informatie: • Probleem1. • Analoge formaten verdwijnen en moeten vervangen worden door digitale alternatieven • Snelle groei data • Incompatibiliteit tussen korte levensduur van digitale technologie en de nood aan archivering op lange termijn • Probleem2. • In digitale vorm is informatie iets abstracts, onafhankelijk van het opslagmedium waarop ze bewaard wordt. De abstracte representatie – dus niet het medium – moet gedurende een lange periode bewaard worden.
SOTA Risico’s op lange termijn: Interpretatie van het formaat Bit Errors/Bugs Wijzigingen File Formaat Veranderende Technologie Organisatorische wijzigingen Tijd 1980 1990 2000
SOTA • Open Archival Information System (OAIS): • Referentiemodel voor de beschrijving van digitale archieven • Ontwikkeld in 1982 binnen een forum van internationale ruimtevaartorganisaties • NASA (US) • ESA (EU) • RSA (USSR) • NASDA (Japan) • … • Vanaf 1990 via ISO in een standaardisatieprogramma • Tal van internationale conferenties • Sinds 2002 ISO Standaard 14721
SOTA • OAIS model: • Opgebouwd uit 3 delen: • Beschrijving van een archiefsysteem: verantwoordelijkheden, procedures en gemeenschappelijke terminologie. • Functioneel model: alle werkprocessen die nodig zijn voor de lange termijnbewaring van digitale informatie. • Informatiemodel: beschrijft de opgeslagen digitale informatie
SOTA • Verschillende niveaus van databeleving: • Bits & Bytes • Foutherstellende HW & SW • Representatie digitale bestanden • Migratie van compressie- en bestandsformaten + Behoud Look&Feel • Interpretatie digitale bestanden • Behoud gemeenschappelijke, contextuele archtergrondkennis • Preservatie van het medium • Preservatie van de technologie • Preservatie van de intellectuele inhoud
Gelaagd Metadata Model Descriptieve metadata: Dublin Core Preservatie metadata: Premis Rechten metadata: MPEG-21/REL, INDECS, ODRL, XrML Technische metadata: MPEG-7, Z38.87, AudioMD, VideoMD, TextMD MARC Standaard TIFF Standaard MARCXML PSD TIFF
Gelaagd Metadata Model • Beschrijvende metadata: • Dublin Core (unqualilfied) • Title – Creator – Subject – Description – Publisher – Contributor – Date – Type – Format – Identifier – Source – Language – Relation – Coverage – Rights • Preservatie metadata: • PREMIS: semantic units • Object • Event • Agent • Rights
Gelaagd Metadata Model • PREMIS: Object • Informatie over digitale vorm • Kan gerelateerd zijn aan rechten informatie • Kan deelnemen aan events • 3 subtypes: • File • Bitstream • Representation • Verplicht: • objectIdentifier
Gelaagd Metadata Model • PREMIS: Event • Informatie over acties die van toepassing zijn op objecten b.v. wijzigingen, conversies • Moet gerelateerd zijn aan objecten • Kan gerelateerd zijn aan agents • Verplicht: • eventIdentifier – eventType - eventDateTime
Gelaagd Metadata Model • PREMIS: Agent • Personen, organisaties, software • Kan gerelateerd zijn aan rechten, events • Verplicht: • agentIdentifier
Gelaagd Metadata Model • PREMIS: Rights • Rechten, licenties • Kan gerelateerd zijn aan objecten, agents • Verplicht: • rightsStatement of rightsExtension
Gelaagd Metadata Model • PREMIS: • Te uitgebreid selectie • Extension points externe schema’s • Data Dictionary: • http://www.loc.gov/standards/premis/v2/premis-2-0.pdf
Survey • Bevraagde Instellingen: • RTV • PCCE • VTi • Argos • MOVE • Archiefbank • Felixarchief • VRT
RTV • Digitaal Materiaal: • MXF (met audio, DV25 compressie) – WMA – TGA – PSD – WAV • File based opslag • Metadata: • Beschrijvend: • Databank • P\META • Mogelijkheid tot export in XML • Technisch: • Geen • Thesauri: • Naam redacteur – gemeenten – categorieën • Eigen ontwikkelde applicatie
PCCE • Digitaal Materiaal: • Tekst – Foto`s (800x600) • Niet zoveel A/V materiaal formaat is vrij te kiezen door de instelling • Metadata: • Beschrijvend: • Eigen metadata model (Spectrum) • CIDOC-CRM • Technisch: • Geen • Thesauri: • AAT • Simac
VTi • Digitaal Materiaal: • Matroska – TIFF – JPEG – XVID • Metadata: • Beschrijvend: • Eigen datamodel gebaseerd op MODS • DC • Technisch: • Custom XML (conversies, semi automatisch) • Thesauri: • Eigen historisch gegroeide woordenlijst • Dspace + eigen ontwikkelde applicatie
ARGOS • Digitaal Materiaal: • MPEG2 (DVD) – AVI – TIFF – JPEG – DOC - PDF • Digibeta - DVCAM • Metadata: • Beschrijvend: • Zelf ontwikkeld model • Exporteerbaar naar DC – CDWA – EAD • Technisch: • Wordt bijgehouden,maar niet volgens bepaald schema • Video • Thesauri: • Eigen platte woordenlijst • Eigen ontwikkelde ACCESS applicatie
MOVE • Digitaal Materiaal: • JPEG • Bezit zelf geen digitaal materiaal • Metadata: • Beschrijvend: • ISAD(G) • Technisch: • Geen • Thesauri: • Eigen versie van AAT (NL) • Adlib Archive
Archiefbank • Digitaal Materiaal: • Geen • Metadata: • Beschrijvend: • ISAD(G) • ISAAR (miniem) • ISDIAH (toekomst) • Technisch: • Geen • Thesauri: • Niet hiërarchische lijst van trefwoorden en plaatsnamen • Eigen ontwikkelde applicatie
Felixarchief • Digitaal Materiaal: • TIFF, JPEG2000, WAV (PCM), ODF, PDFa, XML, MXF, MJPEG2000 • Betacam, digital born (origineel) • Metadata: • Beschrijvend: • ISAD(G) • ISAAR • ISDF • Technisch: • Zit mee in AIP • Thesauri: • Authority records – werkprocessen – informatiesysteem • Eigen ontwikkelde applicatie
VRT • Digitaal Materiaal: • JPEG, word, PCM • D10, DV25 • Metadata: • VRT datamodel • Gebaseerd op: • P\Meta • Dublin Core • FIAT • Thesauri: • Begrippen en persoonsnamen • Commercieel pakket Basisweb
To Do • Survey: • TV Limburg • Centrale Discotheek Rotterdam • Uitwerking van gelaagd datamodel in concrete specificaties (Mei, Juni 2009)