350 likes | 458 Views
Standardy digitálních knihoven – nové zkratky. Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>. ... zkratky. Digitální knihovny. výzkum a vývoj (a také rozmach a rozvoj)
E N D
Standardy digitálních knihoven – nové zkratky Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>
... zkratky Standardy digitálních knihoven – nové zkratky
Digitální knihovny • výzkum a vývoj (a také rozmach a rozvoj) • týká se všech paměťových institucí a druhů sbírek (různé role – budovatel, přispěvatel, správce, aj. – často spolupráce institucí) • daleko překračuje rámec tradičních dokumentů, předmětů a listin • objekty vznikají digitálně i digitalizovaně • objekty jednoduché a souborné Standardy digitálních knihoven – nové zkratky
Souborné objekty • odpovídají okolní realitě a vnímání • v digitálních knihovnách se často podle potřeby rozkládají na jednoduché objekty, např.: • digitalizovaná strana (obrázek) knihy • digitální článek (html stránka) časopisu • reklamní klip (video) jako část pořadu • musí být ale uchovávány a prezentovány pohromadě Standardy digitálních knihoven – nové zkratky
Co potřebujeme • nástroj pro uchopení a popis objektů • nástroj pro přenos objektů • nástroj pro „užívání“ objektů jinak řečeno: metadata, protokoly a formáty (a identifikátory ?) Standardy digitálních knihoven – nové zkratky
Standardy • návrh, implementace a realizace digitální knihovny vyžaduje zdroje(čas, peníze, lidé), kterých není nikdy dost • digitální knihovny více než jiné služby mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně... • standardní metadata, protokoly, formáty(a identifikátory?) Standardy digitálních knihoven – nové zkratky
Metadata • popisná metadata (abychom mohli objekt nalézt) • technická metadata (abychom mohli vyjádřit vlastnosti objektu – obrázek, text, audio, ...) • strukturální metadata (abychom mohli propojit objekty a metadata mezi sebou) • administrativní metadata (abychom mohli objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace) Standardy digitálních knihoven – nové zkratky
Příklad metadat PŘÍKLAD – periodikum 19./20. století: • vícenásobná struktura (roky, ročníky, svazky, čísla, strany, články) • metadata titulu vs. metadata čísla vs. metadata článku • metadata pro vyhledávání (např. získaná OCR) • metadata o umístění objektů pro zobrazování a o službách pro dodávání (např. konverze do djvu/pdf formátu) Standardy digitálních knihoven – nové zkratky
Popisná metadata • MARC XML (MAchine-Readable Cataloging)http://www.loc.gov/standards/marcxml/ • DC (Dublin Core)http://dublincore.org/ • TEI P4 / P5 (Text Encoding Initiative)http://www.tei-c.org/ • EAD (Encoded Archival Description)http://www.loc.gov/ead/ Standardy digitálních knihoven – nové zkratky
Další metadata • NISO Z39.87 (Technical Metadata for Digital Still Images) http://www.niso.org/ • JHOVE (JSTOR/Harvard Object Validation Environment) http://hul.harvard.edu/jhove/ • PREMIS (PREservation Metadata Implementation Strategies)http://www.loc.gov/standards/premis/ • proces standardizace není zdaleka hotov! Standardy digitálních knihoven – nové zkratky
Tolik metadat? Standardy digitálních knihoven – nové zkratky
Do kontejneru s nimi! Standardy digitálních knihoven – nové zkratky
METS – příklad kontejneru • METS = standard pro zachycení a výměnu metadat v prostředí digitálních a digitalizovaných objektů • METS = schéma založené na XML • z iniciativy Digital Library Federation (DLF, http://www.diglib.org/) • správcem je Kongresová knihovna (viz www http://www.loc.gov/standards/mets/), elektronická konference na mets@loc.gov • od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD) Standardy digitálních knihoven – nové zkratky
METS – příklad Standardy digitálních knihoven – nové zkratky
METS – základní části METS obsahuje (ale nedefinuje) následujích 6 sekcí metadat: • hlavičku <metsHdr> • popisná metadata <dmdSec> • administrativní metadata <amdSec> • skupiny objektů <fileSec> • strukturální mapa <structMap> • chování podle obsahu <behaviourSec> Standardy digitálních knihoven – nové zkratky
METS – základní části optional METS Header optional optional optional Descriptive metadata Administrative metadata Behavioral metadata required optional File Inventory Structure map převzato z prezentace Smith MacKenzie (MIT, 2003) Standardy digitálních knihoven – nové zkratky
METS – <dmdSec> odkazem • lze je zpracovat dvojím způsobem: • odkazem <mdRef> • druh odkazu: URN, URL, PURL, DOI ... • druh metadat: MARC, EAD, DC, TEI, ... • popisek Standardy digitálních knihoven – nové zkratky
METS – <dmdSec> přímo • přímo v METS dokumentu <mdWrap>: Standardy digitálních knihoven – nové zkratky
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace Standardy digitálních knihoven – nové zkratky
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace převzato z prezentace Smith MacKenzie (MIT, 2003) Standardy digitálních knihoven – nové zkratky
METS – <structMap> • jádro METS dokumentu, které spojuje jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů • vazba je realizována prostřednictvím: • <fptr> ... ukazatel na fyzický soubor v rámci aktuálního METS dokumentu • <mptr> ... ukazatel na jiný METS dokument, který obsahuje požadovanou informaci Standardy digitálních knihoven – nové zkratky
METS – praktické dopady • poměrně náročná datová struktura, kterou nelze pohodlně vytvářet s běžným editorem • vyžaduje koordinaci při implementaci: • existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat • existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat Standardy digitálních knihoven – nové zkratky
METS – přehled implementací http://sunsite.berkeley.edu/mets/registry/ • UC, Berkeley (EAD<>METS) • National Library of Portugal (eContent editor) • California Digital Library (TEI, EAD<>METS) • Culturnet Cymru (TEI<>METS) • FCLA (conversion ETD<>METS) • Harvard, Göttingen, Library of Congress, Oxford, MIT, OCLC, RLG, Stanford, Graz aj. implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool... Standardy digitálních knihoven – nové zkratky
METS – současný stav • z amerického standardu se stává světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005) • rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí) • předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!) Standardy digitálních knihoven – nové zkratky
METS pro uživatele Standardy digitálních knihoven – nové zkratky
METS záznamu strany Standardy digitálních knihoven – nové zkratky
METS záznamu svazku Standardy digitálních knihoven – nové zkratky
Standardy • návrh, implementace a realizace digitální knihovny vyžaduje zdroje(čas, peníze, lidé), kterých není nikdy dost • digitální knihovny více než jiné služby mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně... • standardní metadata, protokoly, formáty(a identifikátory?) Standardy digitálních knihoven – nové zkratky
Protokoly • OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)http://www.openarchives.org/ • OpenURL Z39.88 (OpenURL Framework for Context-Sensitive Services)http://library.caltech.edu/openurl/ • jejich implementace by měla být samozřejmým požadavkem dnešních digitálních knihoven! Standardy digitálních knihoven – nové zkratky
Formáty • volba podle potřeby (pluginy) • čitelnost a velikost (různé techniky, pluginy) • možnost dodání podle přání (pluginy) • s vědomím, že konverze/migrace na horizontu • MIME (Multipurpose Internet Mail Extensions)http://www.iana.org/assignments/media-types/ • projekt JHOVE (validace a popis) Standardy digitálních knihoven – nové zkratky
Identifikátory • na úrovni popisných metadat • sbírky národního významu; pro digitalizované/digitální varianty nelze využít identifikátor tištěné podoby (viz např. ISSN vs. e-ISSN) • lokální sbírky, ideálně jednoznačné identifikátory (instituce – sbírka – záznam) • obvykle lze přidělování kontrolovat (např. sigla pouze pro knihovny) Standardy digitálních knihoven – nové zkratky
Identifikátory • na úrovni ostatních metadat a objektů • jednoznačnost identifikátoru v rámci repozitáře • jednoznačnost identifikátoru v národním rámci • délka identifikátoru (CRC32 vs. MD5) • identifikátor coby validace objektu (použití kontrolních součtů, nikoliv číslic!) • identifikátor objektu musí být součástí metadat • zajištění linkování (i při změně identifikátoru) • identifikátor by měl být uložen mimo objekt • obvykle nelze přidělování kontrolovat Standardy digitálních knihoven – nové zkratky
Shrnutí • standardní metadata, protokoly, formáty(a identifikátory?): • existují metadata + kontejner • existují protokoly • existují formáty • neexistují identifikátory (instituce, sbírky, ...) • vyžadujme je v aktuálním/plánovaném software • je třeba národní koordinace zvláště mezi paměťovými institucemi • je třeba koordinace s vazbou na světové standardy • jedná se o dlouhodobý úkol a vybudování rámce, který musí mít patřičné zdroje Standardy digitálních knihoven – nové zkratky
Děkuji za pozornost. Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>