270 likes | 398 Views
Udział Biblioteki Narodowej w bieżących projektach Europeany. Katarzyna Ślaska Biblioteka Narodowa. Europeana.
E N D
Udział Biblioteki Narodowej w bieżących projektach Europeany Katarzyna Ślaska Biblioteka Narodowa
Europeana „Europeana daje nam okazję do podróżowania w czasie, ponad granicami i w głąb nowych koncepcji dotyczących definicji naszej kultury. Co więcej, pozwala stworzyć więź między ludźmi i ich historią oraz, dzięki interaktywnym stronom i narzędziom, także budować więzi międzyludzkie.” Vivianne Reading, Komisarz UE ds. Społeczeństwa informacyjnego
Współpraca BN i Europeany • EDLnet: Thematic Networks (2007-2009) • Europeana v.1.0 (2009-2011) • EuropeanaTravel (2009-2011) • Europeana v.2.0 (2011-2014) • Europeana Newspapers Online (2012-2015)
Europeana v.2.0 • Projekt finansowany w ramach ICT PSP Work Programme • Koordynatorem jest Europeana Foundation • Realizowany w latach 2011-2014
Partnerzy projektu • Europeana Foundation • Biblioteka Brytyjska • Biblioteka Narodowa Austrii • Uniwersytet Humboldta w Berlinie • Ministerstwo Kultury, Hiszpania • Biblioteka Narodowa Polski • Instytut Audiowizualny, Holandia • Narodowy Instytut Audiowizualny, Francja • Consiglio Nazionale delle Ricerche, Italy • Department of Tourism, Culture and Sport, Ireland
Cele projektu Europeana v.2.0 • Rozwój portalu Europeana, wzbogacenie jego zawartości cyfrowej i poprawa funkcjonalności • Poprawa satysfakcji użytkownika • Lepsza koordynacja prac i poszerzenie sieci współpracujących z Europeaną instytucji i organizacji
European Cultural Commons European Cultural Commons to strategia rozumiana jako zespół działań zakładający masowe udostępnianie cyfrowe dziedzictwa kulturowego Europy. Jest jednym z najważniejszych zadań zdefiniowanych w Europejskiej Agendzie Cyfrowej 2020.
Konferencja European Cultural Commons • Celem konferencji było wypracowanie wizji realizacji strategii European Cultural Commons poprzez zapewnienie powszechnego dostępu do zdigitalizowanego dziedzictwa kulturowego, zaspokajającego potrzeby i oczekiwania zróżnicowanych grup użytkowników. Efektem prac ekspertów będzie analiza problemów w zakresie cyfrowego udostępniania dziedzictwa wraz z sugestiami sposobów ich rozwiązania.
Second European Cultural Commons Strategic Briefing • 30 października 2012 • Limassol, Cypr • Kontynuacja dyskusji zainicjowanej na konferencji w Warszawie • Przygotowanie rekomendacji do omówienia podczas Europeana Annual General Meeting
Europeana Newspapers – dlaczego prasa? „Gazety są wskazówką sekundową historii" Arthur Schopenhauer Dlaczego gazety? Interesujące dla różnych grup odbiorców Projekt wpisuje się w politykę UE oraz realizuje cele Europeany W bibliotekach czasopisma są pomiędzy: niebem = pełne ciągi zasobów, mikrofilmy wysokiej jakości i piekłem = niska jakość oryginałów, brakujące numery i dodatki, kopie mikrofilmowe złej jakości, prawa autorskie do współczesnych gazet
Europeana Newspapers: Plany i zamierzenia Agregacja i poprawa jakości reprodukcji cyfrowych gazet w Bibliotece Europejskiej i w portalu Europeana Zastosowanie nowoczesnych narzędzi wspierających OCR, OLR (segmentacja tekstu na artykuły) i rozpoznawanie nazw własnych (NER) Biblioteki biorące udział w projekcie dostarczą do Europeany 18 milionów stron gazet Kolejne biblioteki będą zachęcane do przekazywania reprodukcji gazet do Biblioteki Europejskiej i Europeany
Założenia projektu Europeana Newspapers Konsorcjum składa się z 17 partnerów reprezentujących 12 państw Biblioteki narodowe Biblioteki uniwersyteckie Inne jednostki Projekt zakłada zaangażowanie bibliotek nie wchodzących w skład konsorcjum Finansowany jest w ramach Best Practice Network programu ICTPSPKomisji Europejskiej Realizowany jest od lutego 2012 do lutego 2015 r.
Konsorcjum Europeana Newspapers NLE NLF LIBER SUB HH NLL CCS USAL NLP SBB BL ONB KB NLT UIBK BnF UB LFT
Partnerzy projektu 9. Uniwersytet w Salford10. CCS Content Conversion Specialists GmbH11. LIBER12. Biblioteka Narodowa Łotwy13. Biblioteka Narodowa Turcji14. Biblioteka Uniwersytecka w Belgradzie 15. Uniwersytet w Innsbrucku16. Biblioteka Dr. Friedricha Tessmanna17. Biblioteka Brytyjska 1. Biblioteka Państwowa w Berlinie (koordynator)2. Biblioteka Narodowa Holandii3. Biblioteka Narodowa Estonii4. Biblioteka Narodowa Austrii5. Biblioteka Narodowa Finlandii6. Biblioteka Uniwersytecka w Hamburgu7. Biblioteka Narodowa Francji8. Biblioteka Narodowa Polski
Cele European Newspapers Online 1) Wybór, obróbka cyfrowa i agregacja prasy europejskiej Europeana stanie się największą biblioteką cyfrową gazet Wzbogacenie Europeany o 18 milionów stron gazet, w większości przeszukiwalnych pełnotekstowo Przeprowadzenie procesów OCR i segmentacji tekstu 2) Analiza istniejących zasobów prasy Zgromadzenie informacji o europejskich kolekcjach gazet 3) Przygotowanie rekomendacji i zestawu dobrych praktyk Opracowanie wzorcowej ścieżki digitalizacji prasy Przygotowanie rekomendacji dotyczących digitalizacji, obróbki cyfrowej, ścieżki digitalizacji, metadanych oraz narzędzi ewaluacyjnych 4) Udostęnienie gazet z możliwością przeszukiwania pełnotekstowego Poprawa dostępu do kolekcji prasy w Europeania
1) Wybór, obróbka cyfrowa i agregacja zasobów Agregacja 18 milionów stron gazet doEuropeanoraz Biblioteki Europejskiej 8 milionów stron bez obróbki cyfrowej 10 milionów stron z przeprowadzonym procesem OCR (Uniwersytet w Insbrucku) 2 milionystron z przeprowadzonym procesem OCR oraz OLR (segmentacja tekstu) (CCS, Germany) Analiza dostarczonych zasobów prasy w postaci cyfrowej i wybór tytułów, przeznaczonych do obróbki cyfrowej www.europeana.eu/ www.theeuropeanlibrary.org/
1) Obróbka cyfrowa – OCR i OLR • 10 milionów stron z OCR: Uniwersytet w Insbrucku • 2 miliony stron z OCR iOLR (firma CCS) • Uniwersytet w Insbruckuwzbogaca OCR o informacje strukturalne na podstawie Document Understanding Platform • CCS wykonuje pliki OCR i weryfikuje rozpoznaje szpalt, strukturyzację, segmentację na artykuły i typ strony • CCS dostarcza bibliotekom oprogramowanie umożliwiające wprowadzanie poprawek rozpoznawania tekstu i jego segmentacji CCS: Rozpoznawanie tekstu, segemntacja Innsbruck: Rozpoznawanie nagłówków i przypisóworaz spisów treści
1) Obróbka cyfrowa - Named Entity Recognition Biblioteka Narodowa Holandii prowadzi badania w zakresie rozpoznawania nazw własnych (NER) dla zasobów prasy publikowanych w języku holenderskim, angielskim oraz niemieckim
2) Analiza istniejących zasobów prasy • Do połowy 2012 r. partnerzy projektu dokonają analizy zasobów czasopiśmienniczych w swoich zbiorach • Dane zostaną udostępnione w “Zeitschriftendatenbank” (Centralnym Katalogu Czasopism) Biblioteki Państwowej w Berlinie • Zaproponują również potencjalnych nowych partnerów projektu, którzy mogą swoimi zasobami wzbogacić kolekcję Europeana Newspapers • Analiza będzie obejmowała również ocenę jakości technicznej zdigitalizowanych zasobów prasy i metadanych opisowych • Kontaktowy adres mailowy dla instytucji zainteresowanych współpracą z projektem: survey@europeana-newspapers.eu/
3) Przygotowanie rekomendacji i zestawu dobrych praktyk • Analiza formatów metadanych stosowanych przez partnerów projektu w opisie gazet i czasopism • Zestawienie modeli metadanych ze standardami METS/ALTO i opracowanie rekomendacji dobrych praktyk w zakresie formatów stosowanych do opisu gazet i czasopism przeznaczonych do digitalizacji i obróbki cyfrowej • Przygotowane rekomendacje zostaną przetestowane i poddane ewaluacji • Przygotowanie rekomendacji i zestawu dobrych praktyk w zakresie obróbki cyfrowej reprodukcji cyfrowych gazet przeznaczonych do zamieszczania w portalu Europeana
4) Udostępnienie zasobów prasy • W ramach projektu w portalu TEL zostanie udostępniona przeglądarka umożliwiająca: • Przeszukiwanie pełnotekstoweprzez m.in. • terminy wyszukiwawcze, • nazwy własne, • kolekcje gazet, • daty …. • Przeglądanie reprodukcji cyfrowych gazet • Przejście do zasobów cyfrowych macierzystej biblioteki • Po zakończeniu projektu przeglądarka zostanie przeniesiona do Europeany
Dziękuję za uwagę! Katarzyna Ślaska k.slaska@bn.org.pl