240 likes | 562 Views
Colloque INTD-CNAM (Dicen). CNAM / 31 janvier 2012. La conception technique du système d’information, l’interopérabilité entre sources de données hétérogènes. * Philippe.Bourdenet @univ-lemans.fr. Problèmes d’intégration des outils de référencement dans les systèmes d’information.
E N D
Colloque INTD-CNAM (Dicen) CNAM / 31 janvier 2012 La conception technique du système d’information, l’interopérabilité entre sources de données hétérogènes * Philippe.Bourdenet @univ-lemans.fr
Problèmes d’intégration des outils de référencement dans les systèmes d’information Périodiques en ligne Catalogue collectif Catalogue Catalogues de bibliothèques associées ou partenaires Enregistrements sonores e-books Ressources pédagogiques Ressources multimédias Bases de signets Archives ouvertes Thèses en ligne
Sur le parcours de l’usager… rq1 rq2 rq3 rq4 rq5 rq6 rq7 rq8 rq9 OPAC Images E-books Cédéroms Thèses en ligne Périodiques en ligne Documents sonores Ressource électroniques Ressource pédagogiques Catalogue local Catalogue collectif Bouquet 1 Bouquet 2 Bouquet 3
Alors que l’on aimerait avoir : Point d’entrée unique(1) OPAC Images E-books Cédéroms Thèses en ligne Z39-50 Périodiques en ligne Documents sonores Ressource pédagogiques Ressource électroniques Catalogue local Catalogue collectif Bouquet 1 Bouquet 2 Bouquet 3 1992, «Z3950 and the Scholar’s Workstation Concept » : rendre la recherche accessible dans un domaine donné à partir d’une interface unique [Phillips, Gary Lee] (1)
Schémas de mise en œuvre de l’interopérabilité Interopérabilité de niveau 1 Catalogue d’imprimés (oracle/Mysql) IGP OPAC connecteurs Catalogue de périodiques en ligne (Mysql) Interopérabilité de niveau 2 Recherche frédérée Catalogue d’e-books (Mysql) Ressources pédagogiques Ori-OAI Thèses électroniques Surcouche web capable de « plonger » dans différentes sources (Interface Grand Public)
SIGB (=Système intégré de gestion de bibliothèque) SID (=Système d’information documentaire) Le système d’information documentaire est un dispositif informatique global d’accès à la documentation, aux ressources pédagogiques et à l’information multimédia, depuis un poste de travail ou de consultation banalisé, grâce à une interface unique rendant à l’usager transparents les différents langages et normes des systèmes agrégés constitutifs et lui permettant l’interrogation de bases de données et de différentes ressources, ainsi que l’accès à des services, tels que la commande, la réservation de documents ou d’autres prestations, un album personnel ; ainsi le catalogue Opac du SIGB, le réseau de CD-Rom, les documents internes numérisés (thèses, cours), les abonnements électroniques, les bases de données bibliographiques, textuelles, factuelles, les campus numériques, etc., sont disponibles, selon les habilitations des usagers (gérées par un annuaire central) sur l’Intranet de l’établissement d’enseignement supérieur ou sur Internet, localement ou à distance. Le SID est constitutif du système d’information de l’établissement (ou portail). Souvent, il en est la pierre angulaire. Il résulte d’une organisation et d’une architecture réfléchie au niveau de la direction de l’établissement et de la mise en commun des savoir-faire de la bibliothèque, du centre de ressources informatiques (CRI) et des enseignants-chercheurs pilotes dans les TICE.“ (Marie-Thérèse Rebat) SID (=Système d’ingénierie documentaire) ?
L’architecte de l’information existe-t-il ? Chargé de système d’information documentaire (F) Administrateur de systèmes d’information (E) Intégration de plusieurs logiciels Administration et gestion du SID Interaction entre applications Qualité, cohérence des informations Uniformisation des classes d’authentification Veiller au respect des standards Assurer le stockage, le référencement et l’accès aux ressources ( + continuum référencement > contenu) Contrôler et assurer la cohérence du SI et le respect des standards utilisés Gestion de bases de données (SGBDr, interaction avec DBA) Invention, création, innovation ? Quelle place pour l’architecture ?
Peter Webster, Managing Electronic Resources : New and Changing Roles for Libraries, 2008
iso 2709 Catalogue local Ressources multimédias Bases de signets Catalogue collectif oai-pmh Bibliothèques / agences bibliographiques nationales Z 39.50 Périodiques en ligne OpenURL SRU e-books API Ok v Catalogue de la bibliothèque Catalogues de bibliothèques associées ou partenaires Ressources pédagogiques Z 39.50 v Documentation scientifique et technique v Supports pédagogiques v Documents multimédias v Revues Archives ouvertes v Enregistrements sonores podcasts e-books oai-pmh WebService Thèses en ligne Vidéos FORTE INTEROPERABILITE
L’interopérabilité, qu’est-ce que c’est ? « L’ interopérabilité est la capacité que possède un produit ou un système, dont les interfaces sont intégralement connues, à fonctionner avec d'autres produits ou systèmes existants ou futurs et ce sans restriction d'accès ou de mise en œuvre . » (AFUL) vs compatibilité interopérabilité Cela nécessite une grande transparence sur les mécanismes ou les formats employés… Importance du travail de modélisation des données pour l’évolution des SID
L’intéropérabilité en trois mouvements Elle met en jeu trois niveaux techniques complémentaires(1) : 1. Une description des ressources avec des sémantiques communes 2. Un contexte générique d’implémentation des descriptions dans des langages structurés standardisés, interprétables par des machines 3. Un ou plusieurs protocoles informatiques d’échange de ces données normalisées (1)Abderrazak Mkadmi, Imad Saleh, Bibliothèque numérique et recherche d’informations
Normes en vigueur dans les bibliothèques pour la description bibliographique : Z 44-050Catalogage des monographies - texte imprimé Z 44-063Catalogage des ressources continues Z 44-074 Catalogage des monographies anciennes Z 44-065 Catalogage des vidéogrammes Z 44-066 Catalogage des enregistrements sonores Z 44-067 Catalogage des documents cartographique Z 44-069 Catalogage de la musique imprimée Z 44-077Catalogage des images fixes Z 44-078 Catalogage des parties composantes Z 44-082 Catalogage des ressources électroniques Z 44-073Catalogage des monographies - texte imprimé (description allégée) Z 44-059 Catalogage - Choix des accès à la description bibliographique Z 44-060 Catalogage d’auteurs et d’anonymes : forme et structure des vedettes de collectivités auteurs Z 44-061 Catalogage d’auteurs et d’anonymes : Forme et structure des vedettes noms de personne, des vedettes titres, des rubriques de classement et des titres forgés Z 44-079Catalogage - Forme et structure des vedettes titres musicaux Z 44-081 Z 44-081 Catalogage - Forme et structure des vedettes : Noms géographiques Z 44-070Documentation - Indexation analytique par matières Z 44-005 Documentation - Références bibliographiques : contenu, forme et structure
La boîte à outils du bibliothécaire… L’interopérabilité des systèmes d’informations combine 3 niveaux techniques Jeu de métadonnées : UNIMARC (< Z44-050 et al.) DublinCore, MARCXML MODS METS EAD LOM (Learning Object Metadata) SCORM RDA Cadre générique d’implémentation : ISO 2709 XML URI RDF (Resource Description and Framework) W3C Protocoles : WAIS (Wide area information server) FTP Z39.50 http (BNF) OAI-PMH SRU/SRW
Production de service documentaire Production d’outils informatiques Interaction design Catalogage Gestion de procédures Indexation Constitution de collection Développement (codage) Achat de flux d’informations Processus métiers AI ? Gestion de projet Négociation des accès Tests Gestion de projet Produit Formations Forte culture informatique (processus) Forte culture documentaire (métiers)
Les Bibliothèques nationales et l’accès à l’information : le rôle de TEL et de MACS / Genevieve Clavel-Merrin
SRU Termes de recherche : Ok Bibliothèque du Congrès JSTOR
SRU Termes de recherche : balzacliterature | Ok v Bibliothèque du Congrès JSTOR
SRU Termes de recherche : balzacliterature | Ok v Bibliothèque du Congrès JSTOR Construction d’une requête type SRU à partir des termes saisis : http://z3950.loc.gov:7090/voyager ?version=1.1 &operation=searchRetrieve &query=balzac+and+literature &maximumRecords=2000 &recordSchema=marcxml = URL de base = version de la requête = opération demandée = paramètres de la requête = nb. max. de rép. souhaitées = format de réponse souhaité NB : ici, le format souhaité est le paramètre « marcxml ». Schéma dans lequel la notice doit être fournie. La valeur est l’URI du schéma ou son affichage abrégé défini par le serveur.
http://dfr.jstor.org/sru/?operation=searchRetrieve&query=dc.description+%3D+%22blaise+cendrars%22&version=1.1&operation=searchRetrieve&recordSchema=info%3Asrw%2Fschema%2Fsrw_jstor&maximumRecords=20&startRecord=1&recordPacking=xmlhttp://dfr.jstor.org/sru/?operation=searchRetrieve&query=dc.description+%3D+%22blaise+cendrars%22&version=1.1&operation=searchRetrieve&recordSchema=info%3Asrw%2Fschema%2Fsrw_jstor&maximumRecords=20&startRecord=1&recordPacking=xml
Interopérabilité : recherche fédérée vs recherche intégrée Recherche FEDEREE : interroge des ressources externes Présentation et transport des données : TCP-IP / HTTP / Z3950 / SRU / API / Web services / Connecteurs Faible contrôle des données Dialogue entre applications Expositions des données par flux XML, sortie des données hors des bases Sortie des données des SGBDR pour les exposer dans des formats plus volatiles et plus propices à la manipulation (RDF) Aujourd’hui la recherche fédérée se construit par intégration, pour permettre la manipulation des données recueillies
Conclusion Architecture de l’Information ou… …penser autrement la reconquête de l’intermédiation Construction d’une sémantique commune malgré l’hétérogénéité des sources Cohérence des catalogues Mise en place de processus qualité Tout reste à inventer Changements culturels (l’usager en question, structuration des services autour du numérique) Efforts de modélisation importants (Entente entre institutions / transparence)