220 likes | 330 Views
Přístup k národnímu webovému archivu Tomáš Síbek a Lukáš Gruber. Archivace webu. Proč a jak? Technické řešení Legislativní překážky Návrh zákona o povinných síťových publikacích problematika viděna z pohledu českého projektu WebArchiv
E N D
Přístup k národnímu webovému archivuTomáš Síbek a Lukáš Gruber
Archivace webu • Proč a jak? • Technické řešení • Legislativní překážky • Návrh zákona o povinných síťových publikacích • problematika viděna z pohledu českého projektu WebArchiv • WebArchiv je digitální archiv „českých“ webových zdrojů, které jsou zde shromažďovány za účelem jejich dlouhodobého uchování.
Proč? • důležitost a množství elektronických dokumentů stále roste • velká část vzniká pouze elektronicky – eBorn dokumenty • životnost dokumentů v rámci internetu je krátká • okolo 75 dní • sledujeme problematiku národního webového archivu • česká národní doména .cz
Proč? Srovnání růstu • registr národních domén – provozuje sdružení • září 1999 41 351 registrovaných domén .cz • listopad 2008 484 256 registrovaných domén .cz • nyní jsme na jedenáctinásobku stavu ze září 1999
Proč? Množství obsahu roste
Jak? • výběr webových stránek • uložení do archivu • zpřístupnění uživatelům
Jak? Typy sklizní • celoplošné sklizně (tzv. harvesting) – delší interval • snaha zachytit bohemika na internetu v co největší úplnosti • výběrové sklizně – kratší interval • výběr hodnotných webových stránek s častými aktualizacemi • tematické sklizně • výběry materiálů k významným událostem nebo specifickému tématu • WebArchiv: Prezidentské volby (2008), Nová budova Národní technické knihovny (2007), Praha olympijská (2007); Nová budova Národní knihovny (2007); Volby (2006); Vysočina (2005); Dalimilova kronika (2005); Povodně (2002)
Jak a kde? Software • mezinárodní spolupráce – tvorba opensource nástrojů • International Internet Preservation Consortium (IIPC) • celkem 38 členů z celého světa • Internet Archive – archive.org • nástroje pro ukládání (sklízení) webu • Heritrix • nástroje pro zpřístupnění • WayBack, Wera • neumíme kvalitně sklidit vše – problém s některými formáty • stávající aplikace je třeba inovovat – projekt Living Web Archives
Jak? Zpřístupnění WebArchivu • webarchiv.cz/vyhledej • vyhledávání na základě URL adresy
Jak? Zpřístupnění WebArchivu • index – data, kdy byla daná URL adresa sklizena
Nejen technické řešení • na první pohled je problematika v uspokojivém stádiu řešení • nejedná se ale jen o technické a administrativní otázky • zpřístupňování webových archivů musí být v souladu s národní legislativou
Legislativa v ČR • Zákon č. 121/2000 Sb. o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon), ve znění pozdějších předpisů
Legislativa v ČR • Co smíme • archivovat český web • = vytvořit kopii webové stránky a uložit jí do prostoru zabezpečeného digitálního úložiště • upraveno v AutZ, tzv. knihovní licence • § 37, ods.1 a) „do práva autorského nezasahuje knihovna, archiv…..zhotoví-li rozmnoženinu díla, která neslouží přímému nebo nepřímému hospodářskému nebo obchodnímu účelu, pro své archivní a konzervační účely“. • konzervační (depozitní) funkce Národní knihovny • celoplošné sklizně
Legislativa v ČR • Co ale nesmíme • poskytnout veřejný online přístup k archivovaným webovým dokumentům • Pro online přístup • nutno získat souhlas od držitele autorských práv • Možnosti řešení • uzavření smlouvy • využití veřejné licence (Creative Commons)
Vlastní řešení • Uzavření smlouvy • smlouva o poskytování elektronických online zdrojů • vytvořena v souladu s občanským zákonem • uzavírána na konkrétní URL (včetně subdomén) v tištěné formě • do budoucna zvažována možnost uzavírání smlouvy online
Vlastní řešení • Creative Commons • souhlas s online zpřístupňováním na základě vystavení webových stránek pod licenci Creative Commons • základní informace a návod na aplikaci na stránkách WebArchivu • možnost právoplatně využívat od dubna 2006 (novela AutZ 216/2006 Sb.)
Vlastní řešení • Rozšíření institutu povinného výtisku • v současné době dva zdroje legislativy povinného výtisku: • Zákon č. 37/1995 Sb. o neperiodických publikacích, ve znění zákona č. 320/2002 Sb. • Zákon č. 46/2000 Sb., o právech a povinnostech při vydávání periodického tisku a o změně některých dalších zákonů (tiskový zákon), ve znění zákona č. 302/2000 Sb. a zákona 320/2002 Sb. • Co třeba ještě….? • Zákon č. XXX/XXXX Sb. o povinných síťových publikacích ????
Vlastní řešení • Návrh zákona o povinných síťových publikacích • co řeší: • charakteristiku povinných síťových publikací (zahrnuje i síťové publikace s omezeným přístupem) • povinnosti vydavatele zdroje • instituce, které odpovídají za uchování a zpřístupňování síťových publikací • přístup k archivovaným síťovým publikacím • současný stav návrhu zákona? • návrh předložen ústřední knihovnické radě ČR; nyní v přípravě na legislativním odboru MK ČR
Přístup k webovým archivům v zahraničí • Příklady zemí s legislativou povinné síťové publikace: • Norsko (1990) • Chorvatsko (1997) • Island (2003) • Nový Zéland (2003) • Kanada (2004) • Dánsko (2005) • Slovinsko (2006) • Francie (2007) • Finsko (2008)
Děkuji za pozornost Tomáš Síbek Lukáš Gruber Národní knihovna ČR – WebArchiv http://www.webarchiv.cz
Více informací najdete… • CELBOVÁ, Ludmila, et al. Archivace webu. Praha : Národní knihovna ČR, 2008 [vyjde v průběhu prosince]. • CELBOVÁ, Ludmila. Český web a povinný výtisk – jde to spolu dohromady? Knihovna plus [online]. 2008, č. 1 [vyjde v průběhu prosince]. Dostupný z WWW: <http://knihovna.nkp.cz>. ISSN 1801-5948