170 likes | 306 Views
Exploiter, diffuser et conserver vos images numériques – Aspects techniques. 04 – Bases de données et collections. Martin Sévigny / AJLSM / 10 et 11 juin 2004. Métadonnées. Catalogage et indexation = métadonnées Quatre grandes catégories de métadonnées
E N D
Exploiter, diffuser et conserver vos images numériques–Aspects techniques 04 – Bases de données et collections Martin Sévigny / AJLSM / 10 et 11 juin 2004
Métadonnées • Catalogage et indexation = métadonnées • Quatre grandes catégories de métadonnées • Métadonnées descriptives ou sur le contenu • Métadonnées techniques • Métadonnées administratives ou de gestion • Métadonnées de droit • Deux grandes méthodes de stockage • A part des images • Méthode classique que l’on retrouve dans les outils reliés aux bases de données d’images • Dans les images • Nouvelles méthodes relativement normalisées
Métadonnées • Problèmes reliés à la description • Difficile de bien indexer une image • On peut vouloir l’utiliser dans de nombreux contextes • Seule une partie de l’image peut être tout à fait pertinente pour illustrer un propos sans que ce soit le sujet principal de l’image • On décrit l’image ou ce qu’elle représente ? • Par exemple, une photographie d’un édifice • Différence entre le titre absolu et la légende contextuelle d’une image
Métadonnées • Quelques références • http://www.tasi.ac.uk/advice/delivering/metadata.html • http://www.getty.edu/research/conducting_research/standards/intrometadata/3_crosswalks/crosswalk1.html (comparaison de systèmes de métadonnées) • http://www.ajlsm.com/projets/strabon/wp3/partie-descriptif/datamodel/references/model-image.html (étude et synthèse de différents modèles de données) • http://peccatte.karefil.com/software/Metadata.htm
Métadonnées • Normes de description • Rien d’universel • Quelques formats de description largement utilisés • Système descriptif de l’illustration • http://www.extranet.inventaire.culture.gouv.fr/culture/inventai/telechar/illus.pdf • Categories for the Description of Works of Art (CDWA) • http://www.getty.edu/research/conducting_research/standards/cdwa/ • Dublin Core Metadata Terms • http://www.dublincore.org/documents/dcmi-terms/
Métadonnées dans l’image • EXIF • Métadonnées techniques • Largement supporté par les appareils photos numériques • Développé par Japanese Electronic Industry Development Association • http://exif.org/ • Peut être stockées dans des fichiers JPEG et TIFF • Quelques métadonnées non-techniques, mais c’est très limité • Commentaire, auteur, description, droits
Métadonnées dans l’image • IPTC • International Press and Telecommunications Council • http://www.iptc.org/IIM/ • Métadonnées descriptives et de droit • Norme de plus en plus répandue • Correcte pour des besoins standards • Pas de gestion de la description multilingue • De plus en plus de support dans un grand nombre de logiciels • Images JPEG et TIFF
Métadonnées dans l’image • XMP (Extensible Metadata Platform) • http://www.adobe.com/products/xmp/main.html • Plusieurs ensembles de métadonnées • Autres standards • Dublin Core (non qualifié) • EXIF • Propres à XMP • Propriétés de base • Gestion des droits • Gestion des collections • Autres • Métadonnées Photoshop
Métadonnées dans l’image • JPEG 2000 Metadata • http://www.jpeg.org/jpeg2000/metadata.html • Format XML • Correspondances avec d’autres standards • Quatre grandes rubriques • Création de l’image (données techniques) • Description du contenu • Historique • Propriété intellectuelle
Bases de données d’images • Objectifs • Les mêmes que toute base de données • Stocker • Organiser • Décrire • Repérer, rechercher • Consulter • Spécificités • Taille des objets numériques et donc des bases • Complexité de consultation • Distinction informatique entre le texte (les métadonnées) et les images
Bases de données d’images • Quelques problématiques à considérer • Confier le stockage à la base de données ou lui confier seulement des localisations et réaliser le stockage par ailleurs (dans le système de fichiers par exemple) ? • Quelle architecture informatique utiliser ? • Web / intranet / extranet • Facilité de distribution, mais consultation potentiellement plus limitée • Plug-in ? Alors on perd peut-être la facilité de distribution ? • Application de type client serveur • Coûts de développement ou d’intégration plus élevés ? • Déploiement plus faible • Application locale • Très faible déploiement, mais très grande sophistication des fonctionnalités de recherche et de consultation
Bases de données d’images • Les fonctionnalités par l’exemple • Panorama des solutions informatiques • Organiseurs d’images (exemple : ACDSee) • Catégories • Métadonnées EXIF • Recherche • Albums • Editeurs de métadonnées dans les images • Par exemple PixVue • Albums Web • De très nombreux produits • Exemple : JAlbum
Bases de données d’images • Panorama des solutions informatiques • Bases de données relationnelles • Exemple Access • Bases de données documentaires • Exemple Texto / CINDOC • Logiciels documentaires multimédias • Exemple Archimed / SIM • Digital Asset Management • Exemples • PortFolio • FotoStation
Collections d’images numériques • Problématique • Très grand nombre d’images • Souvent des images très semblables d’une à l’autre • Documents numérisés • Registres • Documents de même type (cartes postales) • Organisation naturelle des images • Séquences, hiérarchies, etc. • Pas de description à la pièce • Toutes les images ne sont pas cataloguées ou indexées individuellement • Des séries d’images sont cataloguées ou indexées
Collections d’images numériques • Organisation • Privilégier une organisation hiérarchique des images • Le système de fichiers peut constituer une bonne base pour valider un modèle d’organisation • Ne pas dépasser un trop grand nombre d’images pour un même dossier • Porter une attention très particulière au nommage • Privilégier des identifiants en partie significatifs • Exemples • FRDAFANCH_00AP_000000001.JPG • FR : Code de pays • DAFANCH : Code d’institution • 00AP : code de fonds au sein de l’institution • Numéro séquentiel de l’image
Collections d’images numériques • Organisation • Privilégier un nommage cohérent avec l’ordre naturel des images • L’ordre alphabétique des noms d’images devrait correspondre à l’ordre naturel de consultation des images • Ne jamais avoir deux images avec le même identifiant ou le même nom de fichier • S’il y a un système de gestion on devrait toujours faire correspondre le nom du fichier (sans l’extension) avec l’identifiant dans le système • Faire participer le prestataire de numérisation à la saine organisation => fichiers de récollement complets
Collections d’images numériques • Catalogage et indexation • Accepter une description qui n’est pas à la pièce • Privilégier une description à multiples niveaux • Décrire le fonds • Décrire les séries • Décrire les dossiers • Décrire certaines pièces • La norme XML EAD (Encoded Archival Description) est particulièrement adaptée pour cette approche à multiples niveaux • En général moins de description technique des images • Ne pas stocker les métadonnées dans les images