290 likes | 397 Views
Stručný úvod do METS. Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>. Místo úvodu. REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: popisná metadata (abychom mohli objekt nalézt)
E N D
Stručný úvod do METS Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>
Místo úvodu REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: • popisná metadata (abychom mohli objekt nalézt) • technická metadata (abychom mohli vyjádřit vlastnosti objektu – obrázek, text, audio, ...) • strukturální metadata (abychom mohli propojit objekty a metadata mezi sebou) • administrativní metadata (abychom mohli objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)
Místo úvodu – příklad PŘÍKLAD – periodikum 19./20. století: • vícenásobná struktura (roky, ročníky, svazky, čísla, strany, články) • metadata titulu vs. metadata čísla vs. metadata článku • metadata pro vyhledávání (např. získaná OCR) • objekty pro zobrazování a služby pro dodávání (např. konverze do djvu/pdf formátu)
METS – základní informace • METS = standard pro zachycení a výměnu metadat v prostředí digitálních a digitalizovaných objektů • METS = schéma založené na XML • z iniciativy Digital Library Federation (DLF, http://www.diglib.org/) • správcem je Kongresová knihovna (viz www http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na mets@loc.gov • od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)
METS – proč ? • analogická situace s automatizací knihovního prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC) • cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.) • digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy • speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D) • standardizace tyto úkoly řeší efektivněji
METS – základní části METS obsahuje (ale primárně nedefinuje) následujích 5 sekcí metadat: • hlavičku <metsHdr> • popisná metadata <dmdSec> • administrativní metadata <amdSec> • skupiny objektů <fileSec> • strukturální mapa <structMap> • chování podle obsahu <behaviourSec>
METS – základní části optional METS Header optional optional optional Descriptive metadata Administrative metadata Behavioral metadata required optional File Inventory Structure map převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – <dmdSec> odkazem • lze je zpracovat dvojím způsobem: • odkazem <mdRef> • druh odkazu: URN, URL, PURL, DOI ... • druh metadat: MARC, EAD, DC, NISOIMG, TEI, ... • popisek
METS – <dmdSec> přímo • přímo v METS dokumentu <mdWrap>:
METS – popisná metadata • přímé vkládání i volání odkazem lze kombinovat • pro stejný objekt lze použít vícenásobný různý zápis (TEI, MARC i DC) • důležité je zachování identifikátorů (jak uvidíme záhy) • využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: • hlavičku <metsHdr> • popisná metadata <dmdSec> • administrativní metadata <amdSec> • skupiny objektů <fileSec> • strukturální mapa <structMap> • chování podle obsahu <behaviourSec>
METS – <amdSec> vyjadřuje různé aspekty objektů: • technické údaje (formát, typ, velikost, ...) • autorská práva • informace o zdroji, ze kterého digitalizované verze vznikla (popisné, administrativní) • informace o cestě, jakou objekt ze zdroje vznikl (konverze, kopie, verze, ...)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: • hlavičku <metsHdr> • popisná metadata <dmdSec> • administrativní metadata <amdSec> • skupiny objektů <fileSec> • strukturální mapa <structMap> • chování podle obsahu <behaviourSec>
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: • hlavičku <metsHdr> • popisná metadata <dmdSec> • administrativní metadata <amdSec> • skupiny objektů <fileSec> • strukturální mapa<structMap> • chování podle obsahu <behaviourSec>
METS – <structMap> • jádro METS dokumentu, které spojuje jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů • vazba je realizována prostřednictvím: • <fptr> ... ukazatel na fyzický soubor v rámci aktuálního METS dokumentu • <mptr> ... ukazatel na jiný METS dokument, který obsahuje požadovanou informaci
<div> vyjadřuje jednotlivé části dokumentu <fptr> odkazuje na identifikátory použité v sekci <fileSec> <mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika) <area> <par> <seq>
METS – <structMap> převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – praktické dopady • poměrně náročná datová struktura, kterou nelze pohodlně vytvářet s běžným editorem • vyžaduje koordinaci při implementaci: • existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat • existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
METS – přehled implementací http://sunsite.berkeley.edu/mets/registry/ • UC, Berkeley (EAD<>METS) • National Library of Portugal (eContent editor) • California Digital Library (TEI, EAD<>METS) • Culturnet Cymru (TEI<>METS) • FCLA (conversion ETD<>METS) • Harvard, Göttingen, Library of Congress, Oxford, MIT, OCLC, RLG, Stanford, Graz aj. implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
METS – současný stav • z amerického standardu se stává světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005) • rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí) • předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
Otázky ? Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>