1 / 46

Les métadonnées à la Bibliothèque nationale de France

Les métadonnées à la Bibliothèque nationale de France. Une vue d’ensemble. Emmanuelle Bermès - emmanuelle.bermes@bnf.fr Bibliothèque nationale de France Département de la bibliothèque numérique. PLAN. Introduction Métadonnées : essai de définition Décrire, représenter

gittel
Download Presentation

Les métadonnées à la Bibliothèque nationale de France

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Les métadonnées à la Bibliothèque nationale de France Une vue d’ensemble Emmanuelle Bermès - emmanuelle.bermes@bnf.fr Bibliothèque nationale de France Département de la bibliothèque numérique Emmanuelle Bermès

  2. PLAN • Introduction • Métadonnées : essai de définition • Décrire, représenter • Rôle des métadonnées descriptives • L’identification • Rôle des métadonnées de structure • Préserver, administrer • Différents types de métadonnées de préservation • Lumière sur la gestion des droits • METS : un format global • Partager, diffuser • Les métadonnées transformées : les interfaces, l’indexation • Un protocole d’échange : l’OAI • Conclusion Emmanuelle Bermès

  3. Métadonnées : essai de définition (1) Des données sur les données ... • qui servent à organiser la connaissance et à utiliser et exploiter le document • internes ou externes • descriptives, contextuelles et structurelles • initiales et ajoutées tout au long du cycle de vie • qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès • administratives et techniques • initiales et ajoutées tout au long du cycle de vie NB : certaines métadonnées sont communes aux deux types. Emmanuelle Bermès

  4. Métadonnées : essai de définition (2) • les métadonnées ne s’appliquent pas à une donnée mais à un ensemble de données signifiant • les métadonnées sont parfois comprises parmi les données de l’ensemble de données signifiant, parfois extérieures à lui • les métadonnées sont des données, soumises aux même défis de production, gestion, conservation que les données elles-mêmes... Emmanuelle Bermès

  5. Métadonnées : essai de définition (3) • La gestion d’un objet numérique complexe implique : • une gestion complexe du descriptif (une ou plusieurs notices, descriptions à niveaux) • une gestion complexe des aspects techniques (s’il y a différents formats de fichier par ex.) • une gestion complexe des aspects administratifs (droits, suivi des évolutions du document, suivi des évolutions des métadonnées) • une gestion complexe de sa structure physique (organisation des fichiers entre eux) • une gestion complexe de sa structure logique (organisation des parties du contenu entre elles) • C’est le rôle des métadonnées. Emmanuelle Bermès

  6. Métadonnées : essai de définition (4) Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux identifiant unique (localisation / identification) ? • Métadonnées descriptives • rattacher le document à l’original / différentes versions d’un document • donner accès à la copie numérique / électronique • Métadonnées de structure • rattacher les fichiers entre eux • reconstituer la structure du document • Métadonnées administratives • gérer la collection, c’est-à-dire • gérer les droits d’accès • préserver les informations techniques nécessaires à la lecture des fichiers • garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications Emmanuelle Bermès

  7. PLAN • Introduction • Métadonnées : essai de définition • Décrire, représenter • Rôle des métadonnées descriptives • L’identification • Rôle des métadonnées de structure • Préserver, administrer • Différents types de métadonnées de préservation • Lumière sur la gestion des droits • METS : un format global • Partager, diffuser • Les métadonnées transformées : les interfaces, l’indexation • Un protocole d’échange : l’OAI • Conclusion Emmanuelle Bermès

  8. Décrire, représenter • Les métadonnées descriptives : • appréhender le contenu d’un objet • description bibliographique approfondie et détaillée • identifier un objet ou un groupe d’objets • description bibliographique minimale • identifiant pérenne • identifier les parties qui composent un objet • information de structure • échanger des objets ou des descriptions d’objets • description bibliographique dans un format normalisé Emmanuelle Bermès

  9. Le rôle des métadonnées descriptives (1) Dans le modèle OAIS : Information d’identification Identification interne Identification Globale description de la ressource Cote d'origine URL Auteur ID du fichier ISBN Titre Donne le moyen d’identifier le document Emmanuelle Bermès

  10. Le rôle des métadonnées descriptives (2) • Une tradition dans les bibliothèques • Le catalogage : création d’information descriptive secondaire (notice) qui caractérise une information primaire (document) • Les métadonnées : des données (secondaires) sur les données (primaires) • Caractéristiques du catalogage : • un contenu normalisé : ISBD, AACR... • Un format pour le traitement informatique : MARC (Machine readable cataloguing) • une notice bibliographique c’est… • une description d’un objet matériel • des « points d’accès » pour retrouver le document • une localisation pour se le procurer Emmanuelle Bermès

  11. Le rôle des métadonnées descriptives (3) • Du catalogage aux métadonnées • les métadonnées • une description d’un objet matériel ou non, les métadonnées peuvent être dans le document lui-même • multiplication des « points d’accès », information structurée • une localisation : URL / URN / URI • De nouveaux formats • pour les notices : Dublin Core, EAD + formats dérivés de MARC en XML (MarcXML, MODS, BiblioML) • nouveau : pour le contenu des documents eux-mêmes • autrefois on n’entrait pas « dans » le document • nouveaux besoins : OCR, tables des matières en saisie… • nouveau formats : TEI Emmanuelle Bermès

  12. L’identification (1) • Problématique : • passer d’un nom de fichier à une URI • objectifs • de citabilité (pour les utilisateurs d ’une ressource) • d’identification (pour les machines chargées de localiser une ressource sur un réseau) • fonctionnalités des identifiants (URN) : • unicité - pérennité - granularité - adaptabilité - extensibilité - indépendance - résolution Emmanuelle Bermès

  13. L’identification (2) • Les systèmes d’identification existants et normalisés sur le plan international : • systèmes non spécifiques au Web : ISBN... • spécifications du W3C : URI, URN, URL • systèmes de nommage du monde de l’édition électronique : Handle, DOI • systèmes de redirection : PURL, POI • systèmes indépendants : ARK • les propriétés de ARK • spécificité : le « qualifier » Emmanuelle Bermès

  14. Le rôle des métadonnées de structure (1) • Les métadonnées de structure : • connaître tous les fichiers qui composent un document • y compris les fichiers de différents formats (texte / image) • y compris les fichiers de différentes natures (versions) • connaître la relation physique entre ces fichiers • ordre d’affichage • fichier cible qui donne accès à l’ensemble • ... • connaître la relation logique entre ces fichiers • délimitation de chapitres, de séries • détail du contenu d’un fichier • ... Emmanuelle Bermès

  15. Le rôle des métadonnées de structure (2) • Un document complexe peut avoir plusieurs niveaux d’accès ou niveaux de granularité • Document simple : pas de problème de structure en soi, mais peut tout de même avoir plusieurs niveaux d’accès Collection Document (notice bibliographique) Vue de détail (article) Volume, tome, fascicule... Page Vue de détail Lot (notice bibliographique) Collection Image (légende) Emmanuelle Bermès

  16. Le rôle des métadonnées de structure (4) Arborescence à gérer : Périodique Série Monogr. à Plusieurs Vol. (MPV) Document Multimédia multi-support (MMS) Ensemble Groupe d'Objets Volume Fascicule Cassette, disque, disque vinyle, planche de diapos, disquette, Page Fichier html Face d'un disque Objet Vue de détail (fichier image) Fichier texte Fichier vidéo Fichier audio Image (d'une planche de diapo, d'un fichier html) Fichier Emmanuelle Bermès

  17. PLAN • Introduction • Métadonnées : essai de définition • Décrire, représenter • Rôle des métadonnées descriptives • L’identification • Rôle des métadonnées de structure • Préserver, administrer • Différents types de métadonnées de préservation • Lumière sur la gestion des droits • METS : un format global • Partager, diffuser • Les métadonnées transformées : les interfaces, l’indexation • Un protocole d’échange : l’OAI • Conclusion Emmanuelle Bermès

  18. Préserver, administrer • Les métadonnées administratives : • métadonnées techniques • pour la conservation (migration, émulation) • pour la restitution (pour savoir comment visualiser ce qu’on a conservé) • métadonnées de gestion des droits • pour contrôler l’accès (droits d’auteur, confidentialité) • pour contrôlerl’usage (un fois qu’on a accédé au document, droit de l’imprimer, le copier, le modifier…) • métadonnées de source et de provenance • pour faire le lien avec un document source / original, analogique ou non • pour conserver l’historique des modifications subies par l’objet numérique Emmanuelle Bermès

  19. Métadonnées de préservation (1) Dans le modèle OAIS : Information de Représentation Matériel Système d'exploitation Compilateur Interpréteur Format Application Microprocesseur Nom Nom Nom Nom Multimedia Version Version Version Version Périphérique Instruction Emmanuelle Bermès

  20. caractéristiques techniques communes : File path File name and extension Former file name File size File date and time MIME type File format File format version Target indicator caractéristiques techniques particulières : Image (récupérées à partir des en-têtes TIFF) Audio Video Texte Base de données Fichiers systèmes (exécutables) Métadonnées de préservation (2) • Exemples de métadonnées techniques extraites automatiquement au niveau du fichier Emmanuelle Bermès

  21. Gestion des droits (1) • Les droits de propriété intellectuelle • le droit moral • le droit patrimonial • droit de reproduction • droit de représentation • autres : droits voisins, propriété industrielle • Conséquences pour le document numérique / électronique • sur la diffusion au public • sur la reproduction à des fins de conservation Emmanuelle Bermès

  22. Gestion des droits (2) • Droits d’usage et droit d’accès • un contexte d’utilisation • quel type d’utilisateur ? • quelle application ? • des permissions : trouver, voir, imprimer, copier, modifier, détruire • des contraintes : qualité, quantité, prix... Emmanuelle Bermès

  23. Gestion des droits (3) • Gestion des droits • Rights Declaration • Rights category • Other category type • Rights beginning date • Application duration • Rights end date • Rights contractref • Contract Type • Origin • Rights Holder • RightsHolder Name • RightsHolder Dates • RightsHolder Responsibility • Authority Record Reference • RightsHolder Comments • RightsHolder Contact • Users Rights - Context (Utilisateurs concernés par la déclaration des droits) • User type • Permissions • Constraints Emmanuelle Bermès

  24. METS : un format global (1) • Metadata Encoding and Transmission Standard (METS) • implémentation du modèle de référence OAIS (Open Archival Information System) • schéma XML défini pour permettre la création d’un fichier de métadonnées • contenant la description de la structure hiérarchique d’objets numériques constituant une ressource numérique • répertoriant les noms et la localisation des fichiers correspondant à ces objets • contenant toutes les métadonnées associées • descriptives • administratives (technique - source - droits - provenance) Emmanuelle Bermès

  25. METS : un format global (2) • Conserver : • METS permet de regrouper dans un seul fichier • toutes les métadonnées d’un document • des pointeurs vers des métadonnées qui décrivent le document et sont stockées ailleurs • éventuellement, les fichiers qui composent le document • Il réserve une place particulière aux métadonnées techniques et administratives, essentielles pour la conservation à long terme du document numérique • Il préserve l’intégrité des documents complexes grâce à une carte de structure Emmanuelle Bermès

  26. METS : un format global (3) • Donner accès • grâce à un système élaboré de pointeurs, METS permet de relier entre eux les différents fichiers qui constituent un document, et de relier les métadonnées avec les fichiers qu’elles décrivent • grâce à la carte de structure, METS permet de reconstruire la navigation dans le document, qu’elle soit linéaire ou logique • METS est un schéma XML ; il est donc possible d’utiliser les technologies XML standard pour réaliser une interface de consultation à partir d’un fichier METS. Emmanuelle Bermès

  27. METS : un format global (4) • Echanger • METS est un standard ouvert basé sur XML • S’appuyant sur des outils de collaboration (liste de discussion, exemples, METS implementation registry, partage d’outils…) • De plus en plus adopté notamment dans les bibliothèques • pour faciliter l’intéropérabilité, il s’appuie sur les METS application profiles Emmanuelle Bermès

  28. METS : un format global (5) • 7 sections : • Header : informations sur le document METS • Descriptive metadata Section : métadonnées descriptives externes ou encapsulées • Administrative metadata Section : métadonnées techniques, droit, source, provenance • File section : liste des fichiers composant l’objet • Structural map : carte de structure, peut être logique ou physique, répétable • Structural links : liens entre différents éléments de la carte de structure • Behavior : association d’exécutables Emmanuelle Bermès

  29. METS : un format global (6) • Les blocs de métadonnées de METS sont des « capsules », des enveloppes vides • qu’on remplit avec un lien (pointeur) vers autre chose • qu’on remplit avec des données dans un autre format • Les formats complémentaires : • principaux formats XML de métadonnées • tout document en XML ou encodé en base 64 • les schémas d’extension Emmanuelle Bermès

  30. METS : un format global (7) • Le système de pointeurs : • Mdref + xlink :permet de pointer vers un bloc de métadonnées stocké autre part • DMDID, AMDID : on utilise des identifiants, appliqués à chaque bloc de métadonnées, pour relier les blocs entre eux • fptr : file pointer, permet de pointer vers l’identifiant d’un fichier tel qu’on l’a donné dans la fileSec • mptr : pointeur externe vers un autre fichier METS, permet d’articuler plusieurs documents METS entre eux • area : élément de la carte de structure qui permet de pointer non vers un fichier, mais vers une partie d’un fichier Emmanuelle Bermès

  31. METS : un format global (8) • Les relations entre les blocs de métadonnées : Mdref mptr AMDID DMDID fptr area Emmanuelle Bermès

  32. PLAN • Introduction • Métadonnées : essai de définition • Décrire, représenter • Rôle des métadonnées descriptives • L’identification • Rôle des métadonnées de structure • Préserver, administrer • Différents types de métadonnées de préservation • Lumière sur la gestion des droits • METS : un format global • Partager, diffuser • Les métadonnées transformées : les interfaces, l’indexation • Un protocole d’échange : l’OAI • Conclusion Emmanuelle Bermès

  33. Les interfaces et l’indexation (1) • Les métadonnées descriptives servent à... • Trouver : • dans le catalogue de bibliothèque • adapté pour la recherche avancée • accès intégré à l’offre de la bibliothèque (numérique/analogique : bibliothèque hybride) • avec un moteur de recherche • recherche simple conforme aux habitudes du web • recherche fine (mots-notice, tables et index en mode texte) • recherche plein texte (au-delà des seules métadonnées descriptives) Emmanuelle Bermès

  34. Les interfaces et l’indexation (2) • Les métadonnées descriptives servent à... • Indexer : • Les moteurs de recherche les utilisent pour indexer les documents • veiller à • l’accessibilité des données • leur structuration • leur pérennité (identifiants) Emmanuelle Bermès

  35. Les interfaces et l’indexation (3) • Les métadonnées descriptives servent à... • Découvrir : l’accès intuitif • la navigation par listes • liste d ’auteurs • liste de titres • l’utilisation des classifications (Dewey) • par époques • par types de documents • par thèmes • … vers les classifications « à facettes » ? Emmanuelle Bermès

  36. Les interfaces et l’indexation (4) • Les métadonnées de structure servent à... • se repérer dans un document complexe • avoir une vue d’ensemble du contenu • accéder à un niveau de granularité plus fin • Quelques pistes : • la pagination (carte de structure physique) • la table des matières (carte de structure logique) • les vignettes Emmanuelle Bermès

  37. Un protocole d’échange : l’OAI (1) • Plusieurs objectifs : • mettre en place des collections numériques partagées • en France : les pôles associés • avec des bibliothèques étrangères (projets thématiques) • améliorer la visibilité des ressources de la BnF sur le Web • dans des portails documentaires (Sudoc) • à travers des SP généralistes (OAIster) • à travers les moteurs de recherche (Yahoo) • améliorer la cohérence de l’offre de ressources numériques de la BnF en interne • utilisation de l’OAI pour créer un moteur de recherche fédéré sur l’ensemble des ressources • voir ex. de la BN d’Australie http://www.nla.gov.au Emmanuelle Bermès

  38. Un protocole d’échange : l’OAI (2) • Un protocole simple et ouvert : • utilise des technologies ouvertes qui sont des standards reconnus sur le Web • protocole HTTP • langage XML • offre une grande liberté d’application • indépendant des logiciels et des plateformes • développement simple et rapide ou approfondi et complexe • et une grande simplicité de mise en œuvre • pas de modification des structures existantes, ce n’est qu’une « couche » rajoutée au dessus de l’architecture de l’archive Emmanuelle Bermès

  39. Un protocole d’échange : l’OAI (3) • Un protocole largement répandu ... • dans les archives ouvertes, • dans les institutions patrimoniales et culturelles • dans le domaine de la recherche d’information sur le Web • moteurs de recherche (Yahoo, Google) • portails documentaires (OAIster, ARC, portails de bibliothèques) Emmanuelle Bermès

  40. Un protocole d’échange : l’OAI (4) • Un protocole qui répond aux questions que se posent aujourd’hui les institutions... • comment diffuser largement et de manière ouverte, tout en gardant le contrôle sur mes données ? • Si je travaille en partenariat et en complémentarité avec d’autres acteurs, comment maintenir mon image et mes flux d’utilisateurs ? • Comment donner accès de manière simple (et transparente pour mes utilisateurs) à un nombre croissant de ressources, néanmoins choisies et validées ? • Comment gérer l’évolution rapide de mes ressources, et de celles de mes partenaires, sans bouleverser sans cesse mon architecture et mes données ? Emmanuelle Bermès

  41. Un protocole d’échange : l’OAI (5) • La création des métadonnées • récupération des notices du catalogue • transformation en Dublin Core • automatisée • avec des tables de conversion • concertation avec les partenaires • pour garantir l’homogénéité des données descriptives sur le réseau Emmanuelle Bermès

  42. Un protocole d’échange : l’OAI (6) • Organisation de la collection dans l’entrepôt pour faciliter le moissonnage sélectif • Création d’ensembles (sets) pour trier les notices • par type de documents (monographies, manuscrits, cartes et plans …) • par dossiers thématiques (=sélection de documents), fonds documentaires (=ensembles cohérents) • avec la classification Dewey pour permettre une sélection par thèmes • Possibilité d’organiser la collection de manière hiérarchique Emmanuelle Bermès

  43. Un protocole d’échange : l’OAI (7) • L’entrepôt de la BnF aujourd’hui… • environ 30 000 notices au format DC simple • 64 ensembles thématiques ou collections décrites en DC • 26 000 monographies, 1300 cartes et plans, 2500 manuscrits et ouvrages de la réserve Emmanuelle Bermès

  44. Conclusion internautes Accès WEB Visualisation Traitement Entrepôt OAI métadonnées en DC Structure physique Tables des matières notices Stockage des documents Stockage Métadonnées descriptives : catalogue Métadonnées en METS Système d’archivage Production prestataires extraction automatique catalogueurs Emmanuelle Bermès

  45. Les difficultés : mettre en place des outils appliquer des normes produire, traiter, maintenir les métadonnées entraîne : les coûts l’organisation Les avantages : visibilité préservation possibilité d’évolution entraîne : gain de temps et de qualité pour la préservation on ne peut pas en faire l’économie Conclusion Enjeux des métadonnées : Emmanuelle Bermès

  46. Conclusion • Pour les bibliothèques, les métadonnées impliquent • une évolution des besoins • plus seulement des métadonnées descriptives • gestion de documents structurés ou à structurer (XML) • une évolution des compétences métier • augmentation des compétences techniques • gérer les compétences documentaires dans un environnement nouveau • un défi • continuer à remplir les missions de conservation et de communication dans un environnement nouveau • collaborer avec d’autres acteurs que les bibliothèques Emmanuelle Bermès

More Related