Les catalogues au défi du Web: p rojets et réalisations d’OCLC en matière de FRBRisation

Angers, 16 mai 2013 Titia van der Werf Senior Program OfficerOCLC Journéed’information CNFPT Les catalogues au défi du Web:projets et réalisations d’OCLC en matière de FRBRisation

OCLC Research

OCLC Research • Département de la recherche (50+ personneslocalisées à Dublin/San Mateo/Leiden); • Ressourcecommunautaire pour et avec les bibliothèques.

La croissance de WorldCat Mesures en April 2012

OCLC Research et FRBR WorldCat: base de données qui renvoie aux documents se trouvantdans les bibliothèques; • Croissance et ‘contamination’ de la base avec des notices de toutessortes= plus de richesse - moinsd’uniformité • Nécessitéd’afficher les résultats à un niveaud’entité plus élevé (exemplaire => oeuvre) • Utiliser le modèle FRBR

The movie Original Version Niveaux des entités FRBR (2002) Based on a graphic in Tillett, Barbara: http://www.iccu.sbn.it/upload/documenti/Tillett.ppt

2004 : premiers résultats • Analyse de WorldCat: Fouille de données et développement d’un algorithme FRBR • Prototypes (FictionFinder, xISBN) • Planification pour l’implémentation de l’algorithme FRBR dansWorldCat (2004-2006)

2004 : algorithme FRBR Catégorieproblématique: Expressions • Traductions • Augmentations • Révisions • etc. et la démarcation avec les catégoriesadjacentes

2004 : algorithme FRBR Spoken word Illustrated edition Spanish edition Abridged edition Adaptation e¹ e² e³ e4 e¹ Expressions Oeuvre¹ Oeuvre² http://www.loc.gov/cds/downloads/FRBR.PDF

2004 : conclusions • La capacité à regrouperrétrospectivement des notices dansunemêmecatégorieestlimitée par les donnéesbibliographiquesdisponibles; • Les distinctions entre les catégories FRBR ne sont pas suffisamentexplicites (zones grises). • Le travail empiriquesoutient et informe le travail de modélisation FRBR

2004 : statistiques • Œuvres avec uneseule manifestation: 78% • Œuvres avec uneseule expression maisplusieurs manifestations: 16% • Œuvres avec plusieurs expressions: 6%

2004 : prototype FictionFinder • Un prototype où 2.6+ millions de notices bibliographiques pour la fiction ontétéregroupées en fonction de l’algorithme FRBR • En raison de la difficulté d'identifier les expressions de manière fiable, les manifestations sont organisées par la langue d'expression

FictionFinder : affichageoeuvre/expression & manifestation

FRBRisation de WorldCat : 2006 – aujourd’hui Genres Traductions Manifestations Reproductions

2009: GLIMIR Avec la croissance de WorldCataprès 2003 : augmentation du nombre de notices “parallèles” pour unemêmemanifestation

2009: GLIMIR • Améliorer les “clusters” • par le dédoublement des notices • et le regroupement des notices de manifestations cataloguéesdans des languesdifférentes et faites en suivant des règles de catalogagedifférentes • Attribuer un identifiantà chaquegroupe de manifestations.

FRBRisation de WorldCat : 2006 – aujourd’hui Genres Traductions Manifestations GLIMIR: Regroupe des notices différentes par la langue et les règles de catalogage Reproductions

2011 : Multilingual Bib Structure • Regrouper le titre original et toutessestraductions • Créer des notices d’autorité pour les titres au niveau de l’œuvre

FRBRisation de WorldCat: 2006 – aujourd’hui Genres Traductions Multilingual Bib structure : regroupe les notices du titre original + sestraductions. Manifestations Reproductions

Used by permission of William Denton

Efforts de recherche à partir de 2011 Fouille de données / machines sémantiques : extraction d’entitésnommées et de relations qui se trouventcachéesdans les champs en textelibre des notices bibliographiques

Efforts de recherche à partir de 2011 Efforts de modélisation des donnéesliées • FRBR et Schema.org • W3C Schema Bib Extend Community Group • BIBFRAME(Bibliothèque du Congrès)

Pour réaliser la promesse du Web des données • Entités et liens doiventêtre non-ambigus et explicités • Maintenir des notices d’autorité pour les entitésimportantes : personnes, œuvres, etc. (VIAF, work-authorities) • Identifiants URI pour les personnes (ISNI), les œuvres, etc. • Exprimer et codifier les liens entre les entités

A propos des URI • Objectif : renforcer la présence/visibilité des bibliothèquessur le Web => les ressourcesbibliographiquesontbesoind’identifiants URI • Relationentrework-id, manifestation-id et oclc-record-id ? • En tantqu’agrégateur, OCLC joueunrôle de pivot quirelie les autoritésgérées par les bibliothèques. Example : VIAF.

Quelques observations pour RDA • Codifier les entitésimportantes (QUOI, QUI, OÙ, QUAND) dans des notices d’autorité • Gérer les liens entre les éléments de description et les notices d’autorité par identifiantnumérique/URI • Codifier la langue de catalogage, les règlessuivies (RDA, Afnor, AACR2, etc.), pas d’abréviations, moins de texte non-structuré…

Quelques observations pour RDA MAIS… ilfaut balancer l’efforthumain. La possibilitéd’appliquer des techniques informatiques pour extraire les entitésnommées des millions de notices bibliographiques et les relier entre ellesestpleine de promesses. Les agrégateurs de métadonnéescomme OCLC et l’ABESont un rôle à jouer pour transformer les notices en triplets et un rôle de pivot pour relier les entités avec les autorités.

Titia van der WerfTitia.vanderwerf@oclc.org Questions?

Les catalogues au défi du Web: p rojets et réalisations d’OCLC en matière de FRBRisation

Les catalogues au défi du Web: p rojets et réalisations d’OCLC en matière de FRBRisation

Presentation Transcript

Collaborating with III, Yankee Book Peddler and OCLC PromptCat to Maximize Technical Services Efficiencies at Record Loa

Lorcan Dempsey VP Research and Chief Strategist Library and Archives Canada, 4 May 2004

Le texte argumentatif SCP 4010-2 et FRA 5143-3

The Future of DDC Is Now! Uncovering the Mysteries of DDC 23 and Beyond

Distributing ILLiad Reports Created Using Microsoft Access

PENDIDIKAN KEWARGANEGARAAN KODE MK : UNO 101 SKS : 3 (3-0) ANTON BUDIARTO, S.H., M.H.

DEĞERLER EĞİTİMİ ÖDÜL YÖNERGESİ UYGULAMA TALİMATI VE ÇALIŞMA TAKVİMİ

PEMODELAN SISTEM Dalam KAJIAN SUMBERDAYA LAHAN

Ilmu tajwid tentang hukum mim mati

MAD DAN WAQAF

STERILISASI PANGAN

Workload Analysis

PROGRAM KIA

Penatalaksanaan Trauma kepala Dr Hanis Setyono SpBS Sub Bagian Bedah Saraf

Find Books and More! (Using TRELLIS Effectively)

WEKA 28 mars 2009

Menguasai cara menggambar kunci untuk animasi

PERILAKU JUJUR

Dragotin Kette

BORIS A. NOVAK

Menguasai cara menggambar kunci untuk animasi

S iklus Hidup serangga org lain ( antraks kulit ) - fase vegetatif