370 likes | 446 Views
UE 304 b Cours_L2.documentation_n°2. Gestion des documents : Formalisation des données bibliographiques. Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA sahbi.sidhom@loria.fr. Formalisation des données bibliographiques. 1. Démarche 2. Paysage
E N D
UE 304 bCours_L2.documentation_n°2 Gestion des documents : Formalisation des données bibliographiques Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA sahbi.sidhom@loria.fr ue304b (S. Sidhom)
Formalisation des données bibliographiques 1. Démarche 2. Paysage 3. Crises de la formalisation bibliographique 4. X-transformation 5. Révolutions ue304b (S. Sidhom)
1. Démarche • Concertation pour une information bibliographique enrichie • Formats de documents (c'est la façon de coder les données) • Normes (dispositions destinées à un usage commun et répété, visant à l'obtention du degré optimal dans un contexte d’échange) • Passerelles d’échange (système logiciel et/ou matériel gérant le passage d'un environnement à un autre, en assurant la conversion des informations d'un format à l'autre) • www.abf.asso.fr/enrichi ue304b (S. Sidhom)
L'origine • Besoins : Enrichissement des OPAC OPAC : (Online Public Access Catalogues) Catalogue en ligne d'une bibliothèque ouverte au public. • Offre : Données enrichies : textuelles et multimédias • Cadre normatif inadapté : Formats d'échange (MARC, MARC21, UNIMARC, TEI, … ) ue304b (S. Sidhom)
La méthode • Discussion entre trois types d'acteurs • Bibliothécaires...et finalement utilisateurs professionnels au sens large • Fournisseurs de systèmes • SIGB : Système Intégré de Gestion de Bibliothèque • Intégrateurs : Constructeur informatique capable de faire fonctionner ensemble des sous-systèmes provenant de fabricants différents • Fournisseurs de données • Acteurs bibliographiques traditionnels • Librairies en ligne • Mode d'organisation • Réunions • Discussion • Apprentissage • Site Web et messagerie ue304b (S. Sidhom)
2. Paysage • Une formalisation structurée et spécialisée : • Normes de catalogage / ISBD • Formats bibliographiques : famille MARC et autres ue304b (S. Sidhom)
Les fondamentaux • Un traitement de la seule information secondaire • La notice bibliographique • à ajouter • Les données sur les exemplaires physiques • La gestion d'accès contrôlés ue304b (S. Sidhom)
Une dissociation peu aisée • entre code et éléments • entre données et présentation • Le catalogage mêle indissociablement les deux • Une séparation nette • entre description et accèsautrement dit, entre affichage et index ue304b (S. Sidhom)
L'approche informatique • Systèmes intégrés • Produits spécifiques aux bibliothèques • Hégémonie de la culture du format bibliographiquel'arbre normatif cache la forêt informatique • Distinction et confusion • entre format d'échange et structure des BDDs • entre données et index ue304b (S. Sidhom)
Le schéma logique / descriptif • norme > format > logiciel • Le schéma réel / physique • logiciel > format > norme ue304b (S. Sidhom)
Complexité, pauvreté • Enchevêtrement des fichiers • Description bibliographique à plusieurs niveaux : • Bibliographique, • exemplaire, • vedette, • autorité • Conversions et accumulation des couches logicielles • Import • Stockage • Export • Affichage • Conversion entre formats et variantes de format(BabelMARC) ue304b (S. Sidhom)
Noms des éléments • de a à z • de 1 à 9 • de 001 à 999 On dirait du MS-DOS ! • Arborescence • Indicateurs, zones, sous-zones une antichambre à deux place: • un rez-de-chaussée, • un sous-sol, c'est maigre ! ue304b (S. Sidhom)
L'acquis des formats MARC • Codification très grande richesse des éléments • Échanges • Importation • Exportation • Ré-informatisation ! • Recherche ! • Possibilité de réduire le catalogage local la résistance est acharnée ue304b (S. Sidhom)
3. Crises de la formalisation bibliographique • Une si tranquille assurance • Inflation des formations sur les formats : UNIMARC / RAMEAU / … • Offres d'emploi réclamant ces compétences • MARC continue et ne se simplifie pas • UNIMARC • MARC 21 • D'autres couches se surajoutent • Z39.50 (ISO 239.50) • Le choc • World Wide Web ue304b (S. Sidhom)
Crise interne • Limites des concepts bibliographiques classiques • Aller plus profondément vers le document lui-même, y compris le document dit "physique" • Tenir compte des ressources électroniques accessibles en ligne • Tenir compte de l'environnement juridique et économique ue304b (S. Sidhom)
Limites du cadre descriptif • Les parties composantesles articles de périodiques les fascicules de périodiques • Les besoins fonctionnels (functional requirements) notions d'œuvre, d'expression, de manifestation schéma 1 | schéma 2 ue304b (S. Sidhom)
Schéma 1 Schéma 2 ue304b (S. Sidhom)
Limites des SIGB • SIGB (Système Intégré de Gestion de Bibliothèque) • système intégré au système d'information (SI) • Les difficultés de l'interrogation simultanée • La diversité des formats, MARCs et autres,est à nu ue304b (S. Sidhom)
Un contexte dépassé • La distinction entre description et accès n'a plus de sens Quel gâchis de stocker des données par lesquelles ont ne peut pas accéder ! • La taille mémoire n'est plus un problème Toutes les normes fondées sur la concision et la limitation des accès sont obsolètes ue304b (S. Sidhom)
Normes et formats ont été conçus en fonction • de la rareté du papier, • de l'espace et • du temps le gaspillage ne pose plus de problème ! • d'un état des ordinateurs et des programmes vieux maintenant de plus de 40 ans ! ue304b (S. Sidhom)
Crise externe • Un « apartheid » bibliographique • Clôture avec les autres professions du livre • Clôture avec le monde de la documentation • Rapports difficiles avec le monde informatique • Clôture même avec une partie des bibliothèques ue304b (S. Sidhom)
... manifestant une rupture de la chaîne numérique • Du manuscrit à l'impression • Catalogage par l'agence bibliographique et/ou la bibliothèque • (Re)numérisation • Document électronique ue304b (S. Sidhom)
La globalisation • Les technologies de l'information • un des agents principal de globalisation du monde • un des terrains concrets de cette globalisation • Le principal acteur : Internet • standards communs • applications communes : navigateur, client universel , interface simplifiée ue304b (S. Sidhom)
Une nouvelle façon de produire des normes • Il n'y a de normes qu'internationales c'est-à-dire très souvent américaines • Il n'y a de normes que partagées par plusieurs métiers le modèle W3C ue304b (S. Sidhom)
Une pression de l'offre et de la demande • Il faut travailler entre secteurs jusqu'ici cloisonnés • Les usagers spécialisés ou non ignorent les clivages techniques qui ont structuré ces secteurs ue304b (S. Sidhom)
Des idées … des solutions ! • Serge Salomon, 1996 • Dick R. Miller, 2000 • Dovey Matthew, 2000 ue304b (S. Sidhom)
Serge SalomonVoyage devant les écransin : Bulletin d'informations de l'ABF n°171, 1996 • Dans le processus d'informatisation des bibliothèques des années 80 : format de données , élaboré par des utilisateurs, dans un contexte technologique tout à fait obsolète (fin des années 60) format qui a été imposé aux développeurs. • Une modélisation menée selon les règles de l'art et sans contraintes de l'historique : le format MARC. ue304b (S. Sidhom)
Dick R. MillerXML and MARC: A Choice or a ReplacementALA annual conference, 2000. • "MARC problems" • Ségrégation des données bibliographiques • Complexité inutile • Limitation des champs fixes • Mélange valeur et propriété des données • Liens insatisfaisants • Sous-champs excessifs ou insuffisants ue304b (S. Sidhom)
Dovey MatthewProvocative PointsZIG meeting, Washington, décembre 2000. • Z39.50 apparaît comme... • trop bibliothécaire (library-centric reputation) • pré-Web ou non-Web • compliqué à implémenter, donc coûteux • On lui reproche une trop grande spécificité • du vocabulaire • du protocole ue304b (S. Sidhom)
4. X-transformation : XMLisation Le XML ? La « bonne » à tout faire ? d'abord, • l'information primaire mais aussi, • l'information secondaire et enfin, • les protocoles ue304b (S. Sidhom)
Arguments d'autorité • Organismes gouvernementaux • ADAE www.adae.gouv.frAgence pour le développement de l'administration électronique • Rapports au Sénat ou ou gouvernement • L'hyper-République : bâtir l'administration en réseau autour du citoyenrapport à Henri Plagnol, secrétaire d'Etat à la Réforme de l'Etat ue304b (S. Sidhom)
Les élites mondialisées Le W3C, notre maître à tous : • XML activity • XML Web services • SOAP, protocole XML • WSDL • ZIG et LoC • ZING • WSDL • SOAP • xCQL • OAI • PHP ue304b (S. Sidhom)
Développement des sigles W3C : World Wide Web Consortium www.w3.org)XML = eXtended Mark-up Language www.w3.org/xml)SOAP = Simple Object Access Protocole (www.w3.org/TR/SOAP)ZIG = Z39.50 Implementer's Group (lcweb.loc.gov/z3950/agency/zig/zig.html)ZING = Z39.50 international next generation (www.loc.gov/z3950/agency/zing)WSDL = Web services Description Language (www.w3.org/TR/wsdl)XQL = eXtended Common Query Language (www.loc.gov/z3950/agency/zing/cql/xcql.htm)OAI = Open Archive Initiative (http://www.openarchives.org et http://www.soros.org/openaccess/fr/index.shtml) ue304b (S. Sidhom)
5. Révolutions • L'information secondaire n'est plus au centre • L'utilisateur ne pense qu'à l'information primaire changement des besoins • Du SIGB au système d'information ancrage ou assimilation ? ue304b (S. Sidhom)
Les données ne sont plus au centre • Ownership versus access • Du système d'information au portail • Les médiateurs ne sont plus au centre • ... mais tout simplement la médiation ue304b (S. Sidhom)
Les bibliothèques ne sont plus au centre • mais un élément parmi d'autres du dispositif d'accès • à l'information, • à la documentation, • à la culture, • aux loisirs, • etc. • entre e-administration et e-commerce ue304b (S. Sidhom)
Conclusion Des • technologies • matériels • standards à partager avec : • le monde du livre • le monde du texte • le monde de la création culturelle et artistique • le monde de l'information et de la documentation • le monde de l'informatique • le monde des institutions publiques • le monde du commerce et de l'industrie • etc. ue304b (S. Sidhom)