240 likes | 428 Views
Metadane w polskich bibliotekach cyfrowych. Joanna Potęga Biblioteka Narodowa. „Cyfrowość bibliotek i archiwów”. Warszawa, 26-27 listopada 2009. Polskie biblioteki cyfrowe. 42 w Federacji Bibliotek Cyfrowych
E N D
Metadane w polskich bibliotekach cyfrowych Joanna Potęga Biblioteka Narodowa „Cyfrowość bibliotek i archiwów”. Warszawa, 26-27 listopada 2009
Polskie biblioteki cyfrowe • 42 w Federacji Bibliotek Cyfrowych • FBC – „serwis ten jest zbiorem zaawansowanych usług sieciowych opartych na zasobach cyfrowych dostępnych w polskich bibliotekach cyfrowych i repozytoriach uruchomionych w sieci PIONIER”. • inne (biblioteki cyfrowe (PGd, ABI), prezentacje internetowe zdigitalizowanych obiektów (BUJ, KUL)) • zasoby: • FBC – dostępnych ponad 300 tysięcy obiektów cyfrowych • zdigitalizowane zbiory bibliotek, archiwów, muzeów, ośrodków badawczych oraz kolekcje prywatne • dokumenty „born digital”
Metadane - dlaczego analiza? • jedno miejsce dostępu do metadanych (FBC) • przekazywanie metadanych do zagranicznych serwisów (m.in. Europeana) • dostęp do informacji (użytkownicy) • środowisko / warsztat pracy bibliotekarzy cyfrowych (w kontekście tworzenia metadanych): • standardy • schematy • praktyka
Metadane - analiza • Biblioteki cyfrowe dostępne w FBC* • 40 bibliotek cyfrowych (pominięto PBI oraz planowaną Morską Bibliotekę Cyfrową) • Analiza: wrzesień – październik 2009 r. • Wykonanie: Agnieszka Wróbel (BUW), Joanna Potęga (BN) * pobieranie metadanych przy pomocy protokołu OAI-PMH w wersji 2.0. - niezależne od stosowanych standardów tworzenia metadanych
Metadane - analiza • Podstawa opisu (dla materiałów digitalizowanych): • Kopia cyfrowa dokumentu oryginalnego (cechy formalne dok. analogowego wraz z informacjami chrakterystycznymi dla dokumentu cyfrowego) - 36 • Rozróżnienie wydawcy i dat wyd. (dok. oryg., dok. cyfrowego) - 3 • Nowy dokument elektroniczny - 1 • Standardy: • Dublin Core - 38* • MARC 21 - 1 • Własny - 1 * Oprogramowanie: 37 – dLibra 2 – własne 1 – VTLS/Virtua
Metadane w polskich BC • BC nie jest katalogiem bibliotecznym • znaczna dowolność przy wpisywaniu danych • większa elastyczność i intuicyjność danych (dla użytkownika, ale w konsekwencji: szum informacyjny) • brak wsparcia takiego jakie daje KHW w katalogach • brak słowników kontrolowanych dla poszczególnych atrybutów (Indeks autorów/twórców, Indeks słów kluczowych)
Metadane w polskich BC • różnice w interpretacji poszczególnych elementów DC (przy zachowaniu jednorodengo nazewnictwa elementów) • nierównoważne informacje w tym samym elemencie • informacja tego samego typu w wielu różnych elementach • przypadki umieszczania wielu wartości w jednym elemencie jako ciągłego tekstu (brak powtórzeń elementu – brak możliwości wyszukiwania po wartości) • umieszczanie wielu informacji poza DC – lokalność informacji
Metadane w polskich BC Czynniki wpływające na jakość: • różnorodność zasobów i ich specyfika • różnorodność praktyk katalogowych instytucji współtworzących BC (także w BC konsorcyjnych) • mechanizmy tworzenia metadanych przez bibliotekarzy / redaktorów cyfrowych (ankieta październik/listopad 2009): 41 bibliotek – 29 odpowiedzi): - tylko import bez ingerencji w dane – 1 - tylko import z ingerencją w dane – 3 - import i też samodzielne tworzenie opisów – 10 - samodzielne tworzenie opisów - 14
Metadane w polskich BC • Import – dane wyjściowe: • MARC21 – 12 (+1 w przygotowaniu) • MARC – 1 • MARC BN – 1 • MASTER – 1 (plany) • Zalecenia do tworzenia opisów: • TAK – 27 • NIE – 2 • Tylko zalecenia ogóle – 15 • Tylko zalecenia szczegółowe – 8 • Ogólne ze wskazówkami opisu dla poszczególnych typów dokumentów - 4
Federacja Bibliotek Cyfrowych • Wyszukiwanie – dane wyłącznie z 15 elementów DC • Możliwość rozszerzenia protokołu OAI o dodatkowe elementy (pod warunkiem ujednoliconego schematu) FBC: „Zróżnicowanie tych opisów jest dla nas przeszkodą: - w realizowaniu nowych zaawansowanych funkcji dla czytelników - realizowaniu nowych zaawansowanych funkcji dla twórców bibliotek cyfrowych - przekazywaniu metadanych obiektów z polskich bibliotek cyfrowych do zagranicznych serwisów”* * Adam Dudczak, Marcin Werla Warsztaty nt. Opracowania zasobów bibliotek cyfrowych, Gniezno 6-8 września 2009 r.
Europeana – poziomy wymagań • Absolutne minimum: • Unikalny i trwały identyfikator obiektu cyfrowego (URL, link do obiektu - isShwonBy i/lub isShownAt) • Minimum (z wykorzystaniem uszczegółowień) • KTO (dc:creator, dc:contributor itp.) • CO (dc:title, europeana:type, dc:language itp.) • KIEDY (dc:date itp.) • GDZIE (dcterms:spatial itp.) • Zwiększenie możliwości dostępu do obiektu: - Rights, Provenance, Format, Relation itp…
Europeana Semantic Elements (ESE) 1. Elementy Dublin Core • Title • Alternative • Creator • Subject • Description • TableofContents • Publisher • Contributor • Date • Created • Issued • Type • Format • Extent • Medium • Identifier • Source • Language • Relation • isVersionOf; hasVersion; • isReplacedBy;replaces; • isRequiredBy; requires; • isPartOf; hasPart; • isReferencedBy;references; • isFormatOf; hasFormat; • conformsTo • Coverage • Spatial • Temporal • Rights • Provenance (dcterms) Elementy DC: rekomendowane ; zalecane ; dodatkowe
Europeana Semantic Elements (ESE) 2. Elementy Europeana • Language – język kraju dostawcy obiektu • Country – kraj dostawcy treści • Provider – dostawca obiektu • Year – rok związany z obiektem (Time Line) • Type – typ obiektu (wg Europeana: Text, Image, Video, Sound) • HasObject – czy jest dostępna „miniaturka” • Object – link do „miniaturki” • Unstored – wszystko czego nie udało się przemapować • Usertag – tagi użytkowników • URI – unikalny identyfikator obiektu • isShownAt – link do obiektu w pełnym kontekście informacji • isShownBy – link do obiektu w najlepszej jakości
Metadane w polskich bibliotekach cyfrowych „Cyfrowość bibliotek i archiwów”. Warszawa, 26-27 listopada 2009
Dziękuję za uwagę Joanna Potęga Biblioteka Narodowa „Cyfrowość bibliotek i archiwów”. Warszawa, 26-27 listopada 2009