240 likes | 382 Views
http://anlplus.jib.cz. ANL+ aneb nová generace analytické bibliografie Martin Vojnar vojnar@multidata.cz. http://anlplus.jib.cz. Co je ANL+. = služba (pro vyhledávání českých článků) = lokální index (pro vyhledávání českých článků). http://anlplus.jib.cz. Historie ANL+.
E N D
http://anlplus.jib.cz ANL+aneb nová generace analytické bibliografie Martin Vojnar vojnar@multidata.cz
http://anlplus.jib.cz Co je ANL+ = služba(pro vyhledávání českých článků) = lokální index(pro vyhledávání českých článků)
http://anlplus.jib.cz Historie ANL+ Na začátku 2011 NK ČR přestala přispívat do kooperačního systému národní článkové bibliografie (báze ANL). Na základě kritických připomínek byl zahájen testovací projekt ANL+. Očekávalo se naplnění daty z digitalizace, daty komerčních agregátorů (NEWTON Media, ANOPRESS IT) a vlastními daty knihoven. Krajské knihovny pokračují v udržování kooperačního systému. Samostatně bude s NK ČR spolupracovat Knihovna AV ČR. Projekt ANL+ byl oficiálně oznámen na konferenci Knihovny současnosti v polovině září 2011.
http://anlplus.jib.cz Co není ANL+ • ANL+ ≠ báze ANL NK ČR • ANL+ ≠ centrální index elektronických zdrojů • ANL+ ≠ součást JIB • lokální index ANL+ není doplněk jiného systému(je to samostatný vyhledávací systém založený na technologii Lucene/Solr) • ANL+ vs. báze ANLNK ČR
http://anlplus.jib.cz Hlavní výhody ANL+ • v moderním discovery systému • vyhledávání v českých článcích • v plném textu / z popisných metadat • výsledky řazené podle nastavitelné relevance • ve vybraných zdrojích (od r. 2011) • náhledy, výňatky a odkazy na plné texty článků
http://anlplus.jib.cz ANL+ jako nová generace bibliografie Projekt se vyvíjel na základě těchto pobídek a potřeb: • reagovat na požadavky koncového uživatele a usnadnit přístup k plnému textu • zachovat možnost kontrolovaného věcného vyhledávání a přístupových termínů • racionalizovat, rozšířit a zkvalitnit analytické zpracování, které je pro podporu vědy a výzkumu nezbytné • integrovat bibliografii s blížícím se projektem národní digitalizace V červnu 2011 bylo rozhodnuto pro tento účel ověřit technologii discovery systému založeného na lokálním indexu.
http://anlplus.jib.cz Co znamená „lokální index“ Lokální index = samostatná aplikace, která provádí agregaci určitých zdrojů dat a zajišťuje jejich indexování a vyhledávání. Zapojené zdroje dat • báze ANL NK ČR (MARC21, ftp, přechod na OAI-PMH, denně) • záznamy NEWTON Media (vlastní XML, ftp, denně) • K4 MZK (FOXML/MODS + WS pro plný text, OAI-PMH, 1x) • produkce KNAV (ePrints, Orbeon, 1x), do konce 2012 přechod do K4 KNAV Příprava agregace lokálního indexu včetně zapojení do JIB začala v červnu 2011 a trvala ca 3-4 měsíce. Denní aktualizace běží od září 2011 plynule.
http://anlplus.jib.cz Obsah „lokálního indexu“ Obsahuje články pouze od r. 2011 – počty záznamů podle zdrojů: • báze ANL NK ČR: 37901 z. • NEWTON Media: 782282 z. (včetně tv/rozhlas. relací) • K4 MZK DEMO: 8223 z. • KNAV ePrints: 461 z. • KNAV Orbeon: 923 z. Celkem 829790 z. Jak vlastně zdrojové záznamy vypadají ?
http://anlplus.jib.cz Ukázka záznamu z báze ANL (MARC21)
http://anlplus.jib.cz Ukázka záznamu NEWTON media (NM-XML)
http://anlplus.jib.cz Ukázka záznamu K4 MZK (FOXML, MODS)
http://anlplus.jib.cz Ukázka záznamu KNAV EPrints (XML)
http://anlplus.jib.cz Zapojení a integrace lokálního indexu ANL+ • má vlastní vyhledávací rozhraní (http://anlplus.jib.cz/) • lze jej zapojit do jiných vyhledávacích systémů (např. Primo/VuFind) • lze jej standardně publikovat webovým vyhledávačům (např. Google) • lze jej zapojit jako zdroj pro vyhledávání v JIB (WS) • lze jej zapojit jako zdroj pro sdílenou katalogizaci v JIB (WS) (http://kfbz.cz/anl/ - autorem J. Kaňka)
http://anlplus.jib.cz ANL+ pro VISK9 – záznamy via Z39.50 via JIB Z39.50 server www.jib.cz:9991 profil GATE_P_ANLPLUS
http://anlplus.jib.cz ANL+ pro VISK9 – záznamy via Z39.50 via JIB • stejný mechanismus jako u běžného přebírání záznamů přes JIB • přidání nového profilu pro stahování záznamů článků • ! dlouho se čekalo na přípravu digitalizace ! (úvodní import do K4 MZK dokončen 4.5. 2012, pro ANL+ zpřístupněno 22.5. 2012 – původně očekáváno v lednu 2012) • na základě připomínek proběhly úpravy mapování polí • identifikátory v poli 024 s označením zdroje • zápis více autorů • zápis v poli 773 / aj.
http://anlplus.jib.cz Další zajímavé vlastnosti ANL+ • upozornění na nové články • pomocí RSS • na základě uloženého dotazu po přihlášení • mobilní přístup (http://iphone4simulator.com/anlplus.jib.cz/mobile) • přístup z více rozhraní • samostatně • z Jednotné informační brány • i pro přebírání záznamů • z jiných discovery systémů (např. KALIKO)
http://anlplus.jib.cz Historie ANL+ (pokr.) Na konci roku 2011 NEWTON Media provádí akvizici ANOPRESS IT. NK ČR dokončuje přípravu digitalizovaných dat (především odborné tituly) a podepisuje smlouvu s Knihovnou AV ČR. Komise VISK9 rozhoduje kladně o podpoření aktivit krajských knihoven v pokračování kooperačního systému na bázi ANL+. 5.4. 2012 jsou potvrzeny standardy národní digitalizace, které jsou použity i projekt ANL+. 22.5. 2012 je importována první část digitalizace. Pod čarou: v roce 2012 startují krajské digitalizační projekty. MZK sehrála aktivní roli ve formulaci standardů pro digitalizaci periodik a monografií, které jsou nezbytné. NK ČR se zabývá projektem Národní digitální knihovny…
http://anlplus.jib.cz Aktuální stav ANL+ NK pokračuje v technické správě báze ANL. K 29.5. 2012 obsahuje ANL+ 829790 záznamů článků včetně přepisů vybraných rozhlasových a tv relací. V květnu rozhodnuto, že NK bude pokračovat v realizaci ANL+ pod záštitou projektu JIB – aktivity mají jednoznačnou podporu a prioritu. Od 1.6. 2012 zahajují kooperativní projekty krajských knihoven.
http://anlplus.jib.cz Statistiky vyhledávání v ANL+ • lze porovnávat počty dotazů v bázích ANL, ANL+ ? • po měsících od září 2011 (ANL01 ca 118 tis., ANL+ ca 60 tis.): • ANOPRESS: počet dotazů 42311 za období září 2010 až duben 2011
http://anlplus.jib.cz ANL+ v druhé pol. 2012 • dokončení doplnění digitalizace (NK ČR a Knihovna AV ČR) • přidání dalších dat / zdrojů ? • rozšíření časového záběru (kompletní doplnění báze ANL?) • archivace webu • Česká tisková kancelář • využití a vyhodnocení v kooperačním systému krajských knihoven(http://kfbz.cz/anl/ - autorem J. Kaňka z KFBZ) • experimenty: • deduplikace a seskupení podle modelu FRBR • automatická indexace na základě plného textu • vícejazyčné vazby a vztahy (sémantický web)
http://anlplus.jib.cz Pár ukázek ANL+ • funkčnost titanic, vzpomínky na titanic • relevance vyhledávání elektronické knihy, open access • duplicity knihovnu stěhovali čtenáři • „kvalita“ dat • automatická indexace • plný text sklad obuvi • digitalizace archeologie • rozhlas & tv hranická propast, poutní místa • použití bib. záznamu krmení bazilišků • ANL+ rozhraní vs. JIB vs. jiné rozhraní (např. KALIKO)
http://anlplus.jib.cz Vybrané zkušenosti … • hledání, jak skloubit tři ideální světy: knihovny, uživatele a digitalizace • je třeba najít způsoby, jak využít to společné a neztratit jedinečné • potvrdilo se, že u lokálních zdrojů je velmi důležitá vlastní kontrola • je dobře, když lze využít stávající systémy a rozšířit jejich schopnosti • digitalizace je nová problematika, ne vždy lze dopředu odhadnout souvislosti a důsledky • uvidíme, co přinese rok 2013
Centrální a lokální index ~ 106-7 ~ 109