170 likes | 293 Views
MANUSCRIPTORIUM: vize virtuálního badatelského prostředí. Zdeněk Uhlíř Národní knihovna České republiky Praha – ÚISK 26.03.2007. Vznik Manuscriptoria. integrace a zpřístupnění originálních historických dokumentů zdigitalizovaných v programu MEMORIAE MUNDI SERIES BOHEMICA
E N D
MANUSCRIPTORIUM:vize virtuálního badatelského prostředí Zdeněk Uhlíř Národní knihovna České republiky Praha – ÚISK 26.03.2007
Vznik Manuscriptoria • integrace a zpřístupnění originálních historických dokumentů zdigitalizovaných v programu MEMORIAE MUNDI SERIES BOHEMICA • vytvoření otevřeného/souborného katalogu historických fondů
Co je MANUSCRIPTORIUM nyní • digitální knihovna sdružující: • katalogové záznamy • digitální obrazy • plné texty • největší digitální knihovna zpřístupňující starší historické dokumenty na světě • cena UNESCO Džikdži 2005
MANUSCRIPTORIUM do škol • mutace pro pomoc výuce na základních a středních školách • výběr dokumentů podle témat • doplnění dokumentů o plné texty • edice primárních dokumentů • sekundární dokumenty • instruktivní návody pro využití při výuce
Vyhledávání dokumentů • jednoduché • kombinované • způsoby – možnosti: • defaultně operátor OR • tolerance • grafické varianty • řetězec/fráze • ve fulltextu • strukturovaně
Prohlížení obrazů • stupně komprese – stupně kvality: • galerie • náhled/preview • nižší/low • vyšší/normal • černobílá/black and white optimisation • nejvyšší/excelentní kvalita v MANUSCRIPTORIU zpřístupňována není • zooming
Partneři MANUSCRIPTORIA • účastníci programu MEMORIAE MUNDI SERIES BOHEMICA – cca 40 institucí v Česku • slovenští partneři užívající téže technologie – UK Bratislava, KAV Bratislava • partneři evropského projektu ECH:TOPICC – KAV Vilno, UK Budapešť, NUK Lublaň • individuální partneři – BU Vratislav, BN Varšava, NUK Záhřeb, VK Oděssa, NK Ankara • partneři evropského projektu ENRICH – 19 plných, cca 10 přidružených • partneři rakouského projektu MONASTERIUM
Evropská digitální knihovna • dlouhodobá snaha MANUSCRIPTORIA o integraci dalších partnerů v mezinárodním a nadnárodním rámci • soustavné úsilí o vůdčí postavení v Evropě • projekt ENRICH: • síťová integrace • znalostní web – ontologie (evropský projekt VICODI) • multilingvalismus • heterogenita
Integrace MANUSCRIPTORIA • JIB – Jednotná informační brána • TEL – The European Library • CERL Manuscripts Portal
Virtuální prostředí dnes • síťová integrace – fyzická agregace do jediné databáze • jednotný vnitřní standard – heterogenita standardů v integrovaném síťovém prostředí • konceptuální rámec/datový model – ideologie markupu/katalogizační pravidlo • flexibilita funkčních struktur – zneužití tagu
Virtuální prostředí - představa • katalogové záznamy – evidenční záznam + vážené doplňující záznamy • digitální obrazové kopie • plné texty primárních dokumentů • plné texty sekundárních dokumentů • audio primárních dokumentů • video sekundárních dokumentů • multimodální dokumenty
Virtuální prostředí v budoucnu – to jednodušší • virtuální realita – faktoid -> jedno-jednoznačná korelace fyzických originálních dokumentů a digitálních kopií i elektronických katalogových záznamů • využití OCR pro vyhledávání • exemplářový (item) – bibliografický záznam (manifestation) • sdružování/clustering: • exemplářové -> bibliografické záznamy • exemplářové záznamy -> institucionální sdružení
Virtuální prostředí v budoucnu – to složitější • vyhledávání podle ontologií/sémantických sítí • vyhledávání podle komplexů/syntagmat • využití komplexů pro citační analýzu/bibliometrii • sdružování/clustering plných textů primárních dokumentů na základě míry podobnosti • vytváření virtuálních dokumentů
Virtuální prostředí v budoucnu – to nejobtížnější • sémantické vyhledávání nad celou databází (primární, sekundární, terciární dokumenty) • sémantický multilingvalismus • využití komputační lingvistiky pro rozpoznání fluidního textu a práci s ním • obousměrné/protisměrné větvení (FRBR předpokládá pouze jednodměrné shora): • nejenom: work -> expression -> manifestation -> item, • ale i: item -> manifestation -> expression -> work, • tudíž také: problém worxpression • multilingvalismus textové tradice
ukázky (1) Manuscriptorium Manuscriptorium do škol preview plných textů
ukázky (2) JIB TEL CERL Manuscripts Portal
DĚKUJI ZA POZORNOST Zdenek.Uhlir@nkp.cz