1 / 25

WP3 UGent-Boekentoren UGent-MMLab

WP3 UGent-Boekentoren UGent-MMLab. WP3. SOTA Gelaagd Metadata Model Survey To Do. SOTA. Doelstelling rapport: inzicht krijgen in … Structurele eisen voor beschrijving van digitale MM Gangbare bestandsformaten & compressieformaten voor opslag en uitwisseling van MM

trista
Download Presentation

WP3 UGent-Boekentoren UGent-MMLab

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. WP3 UGent-Boekentoren UGent-MMLab

  2. WP3 • SOTA • Gelaagd Metadata Model • Survey • To Do

  3. SOTA • Doelstelling rapport: inzicht krijgen in … • Structurele eisen voor beschrijving van digitale MM • Gangbare bestandsformaten & compressieformaten voor opslag en uitwisseling van MM • Beschikbare metadatastandaarden per sector • Beschrijvend, technisch, … • Best-practices langetermijn bewaring MM • Nodige (meta) datamodel voor langetermijn bewaring

  4. SOTA • Problemen met archivering van digitale informatie: • Probleem1. • Analoge formaten verdwijnen en moeten vervangen worden door digitale alternatieven • Snelle groei data • Incompatibiliteit tussen korte levensduur van digitale technologie en de nood aan archivering op lange termijn • Probleem2. • In digitale vorm is informatie iets abstracts, onafhankelijk van het opslagmedium waarop ze bewaard wordt. De abstracte representatie – dus niet het medium – moet gedurende een lange periode bewaard worden.

  5. SOTA Risico’s op lange termijn: Interpretatie van het formaat Bit Errors/Bugs Wijzigingen File Formaat Veranderende Technologie Organisatorische wijzigingen Tijd 1980 1990 2000

  6. SOTA • Open Archival Information System (OAIS): • Referentiemodel voor de beschrijving van digitale archieven • Ontwikkeld in 1982 binnen een forum van internationale ruimtevaartorganisaties • NASA (US) • ESA (EU) • RSA (USSR) • NASDA (Japan) • … • Vanaf 1990 via ISO in een standaardisatieprogramma • Tal van internationale conferenties • Sinds 2002 ISO Standaard 14721

  7. SOTA • OAIS model: • Opgebouwd uit 3 delen: • Beschrijving van een archiefsysteem: verantwoordelijkheden, procedures en gemeenschappelijke terminologie. • Functioneel model: alle werkprocessen die nodig zijn voor de lange termijnbewaring van digitale informatie. • Informatiemodel: beschrijft de opgeslagen digitale informatie

  8. SOTA • Verschillende niveaus van databeleving: • Bits & Bytes • Foutherstellende HW & SW • Representatie digitale bestanden • Migratie van compressie- en bestandsformaten + Behoud Look&Feel • Interpretatie digitale bestanden • Behoud gemeenschappelijke, contextuele archtergrondkennis • Preservatie van het medium • Preservatie van de technologie • Preservatie van de intellectuele inhoud

  9. Gelaagd Metadata Model Descriptieve metadata: Dublin Core Preservatie metadata: Premis Rechten metadata: MPEG-21/REL, INDECS, ODRL, XrML Technische metadata: MPEG-7, Z38.87, AudioMD, VideoMD, TextMD MARC Standaard TIFF Standaard MARCXML PSD TIFF

  10. Gelaagd Metadata Model • Beschrijvende metadata: • Dublin Core (unqualilfied) • Title – Creator – Subject – Description – Publisher – Contributor – Date – Type – Format – Identifier – Source – Language – Relation – Coverage – Rights • Preservatie metadata: • PREMIS: semantic units • Object • Event • Agent • Rights

  11. Gelaagd Metadata Model • PREMIS: Object • Informatie over digitale vorm • Kan gerelateerd zijn aan rechten informatie • Kan deelnemen aan events • 3 subtypes: • File • Bitstream • Representation • Verplicht: • objectIdentifier

  12. Gelaagd Metadata Model • PREMIS: Event • Informatie over acties die van toepassing zijn op objecten b.v. wijzigingen, conversies • Moet gerelateerd zijn aan objecten • Kan gerelateerd zijn aan agents • Verplicht: • eventIdentifier – eventType - eventDateTime

  13. Gelaagd Metadata Model • PREMIS: Agent • Personen, organisaties, software • Kan gerelateerd zijn aan rechten, events • Verplicht: • agentIdentifier

  14. Gelaagd Metadata Model • PREMIS: Rights • Rechten, licenties • Kan gerelateerd zijn aan objecten, agents • Verplicht: • rightsStatement of rightsExtension

  15. Gelaagd Metadata Model • PREMIS: • Te uitgebreid  selectie • Extension points externe schema’s • Data Dictionary: • http://www.loc.gov/standards/premis/v2/premis-2-0.pdf

  16. Survey • Bevraagde Instellingen: • RTV • PCCE • VTi • Argos • MOVE • Archiefbank • Felixarchief • VRT

  17. RTV • Digitaal Materiaal: • MXF (met audio, DV25 compressie) – WMA – TGA – PSD – WAV • File based opslag • Metadata: • Beschrijvend: • Databank • P\META • Mogelijkheid tot export in XML • Technisch: • Geen • Thesauri: • Naam redacteur – gemeenten – categorieën • Eigen ontwikkelde applicatie

  18. PCCE • Digitaal Materiaal: • Tekst – Foto`s (800x600) • Niet zoveel A/V materiaal  formaat is vrij te kiezen door de instelling • Metadata: • Beschrijvend: • Eigen metadata model (Spectrum) • CIDOC-CRM • Technisch: • Geen • Thesauri: • AAT • Simac

  19. VTi • Digitaal Materiaal: • Matroska – TIFF – JPEG – XVID • Metadata: • Beschrijvend: • Eigen datamodel gebaseerd op MODS • DC • Technisch: • Custom XML (conversies, semi automatisch) • Thesauri: • Eigen historisch gegroeide woordenlijst • Dspace + eigen ontwikkelde applicatie

  20. ARGOS • Digitaal Materiaal: • MPEG2 (DVD) – AVI – TIFF – JPEG – DOC - PDF • Digibeta - DVCAM • Metadata: • Beschrijvend: • Zelf ontwikkeld model • Exporteerbaar naar DC – CDWA – EAD • Technisch: • Wordt bijgehouden,maar niet volgens bepaald schema • Video • Thesauri: • Eigen platte woordenlijst • Eigen ontwikkelde ACCESS applicatie

  21. MOVE • Digitaal Materiaal: • JPEG • Bezit zelf geen digitaal materiaal • Metadata: • Beschrijvend: • ISAD(G) • Technisch: • Geen • Thesauri: • Eigen versie van AAT (NL) • Adlib Archive

  22. Archiefbank • Digitaal Materiaal: • Geen • Metadata: • Beschrijvend: • ISAD(G) • ISAAR (miniem) • ISDIAH (toekomst) • Technisch: • Geen • Thesauri: • Niet hiërarchische lijst van trefwoorden en plaatsnamen • Eigen ontwikkelde applicatie

  23. Felixarchief • Digitaal Materiaal: • TIFF, JPEG2000, WAV (PCM), ODF, PDFa, XML, MXF, MJPEG2000 • Betacam, digital born (origineel) • Metadata: • Beschrijvend: • ISAD(G) • ISAAR • ISDF • Technisch: • Zit mee in AIP • Thesauri: • Authority records – werkprocessen – informatiesysteem • Eigen ontwikkelde applicatie

  24. VRT • Digitaal Materiaal: • JPEG, word, PCM • D10, DV25 • Metadata: • VRT datamodel • Gebaseerd op: • P\Meta • Dublin Core • FIAT • Thesauri: • Begrippen en persoonsnamen • Commercieel pakket Basisweb

  25. To Do • Survey: • TV Limburg • Centrale Discotheek Rotterdam • Uitwerking van gelaagd datamodel in concrete specificaties (Mei, Juni 2009)

More Related