370 likes | 473 Views
Comment mettre en place un système de catalogage ? L’interopérabilité avec d’autres outils est-elle possible ?. IRD : DSI – IS Responsables : Régis HOCDE et Bruno GRANOUILLAC. PRATLONG Léo – IRD Montpellier – 08/2007. PLAN. I- Présentation de la mission.
E N D
Comment mettre en place un système de catalogage ? L’interopérabilité avec d’autres outils est-elle possible ? IRD : DSI – IS Responsables : Régis HOCDE et Bruno GRANOUILLAC PRATLONG Léo – IRD Montpellier – 08/2007
PLAN I- Présentation de la mission 2- Présentation de MDweb 3- Les thésaurus 4- Architecture de MDweb 5- Installation de MDweb 6- Interopérabilité 7- Conclusion PRATLONG Léo – IRD Montpellier – 08/2007
LA MISSION PRATLONG Léo – IRD Montpellier – 08/2007
ENJEUX • Répondre à la directive européenne INSPIRE : • Publication des métadonnées • Echange et partage de données géographiques • Recenser les données de l’IRD en répondant aux questions : • Où se trouve la donnée ? • Quand cette donnée a-t-elle été produite ? • Que décrit cette donnée ? • De quel type de donnée s’agit-il ? • Faciliter le travail des chercheurs: • Savoir quelles données existent, et où la trouver PRATLONG Léo – IRD Montpellier – 08/2007
OBJECTIFS • Evaluer les fonctionnalités de Mdweb • Créer un guide d’installation sur serveur virtuel Linux CentOs à l’attention des futurs utilisateurs de l’IRD • Installation • Correction • Documentation • Evaluer la possibilité d’une interopérabilité entre Mdweb et d’autres outils de catalogage • Recherche étendue • Jeux de données enrichis • Respect des normes (ISO19115 – ISO19139) • Couvrir le besoin terminologique des chercheurs de l’IRD • Proposition de mot-clé : notion de Thesaurus • Evaluer ces thesaurus • Mettre un portail public d’accès aux métadonnées de l’IRD PRATLONG Léo – IRD Montpellier – 08/2007
Présentation de MDweb PRATLONG Léo – IRD Montpellier – 08/2007
MDWEB = Présentation • Outil de catalogage de métadonnées sous forme de portail web • Serveur cartographique de localisation de données • Interopérabilité : Z3950, CSW • Modification de la structure des métadonnées • Indexation des métadonnées à l’aide d’un thesaurus = Droits d’utilisation • License CeCILL : utilisation libre • Projet soutenu par l’IRD (J-cDesconnets) PRATLONG Léo – IRD Montpellier – 08/2007
MDweb PRATLONG Léo – IRD Montpellier – 08/2007
METADONNEES = Définition • Permet d’obtenir des informations sur une donnée : • Où ? • Quoi ? • Quand ? = Exemple (morceau de métadonnée) 9 PRATLONG Léo – IRD Montpellier – 08/2007
DEFINITIONS GENERALES Thesaurus Mot-clé Décrit Métadonnées Décrit Données PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS = Définitions • Recueil terminologique hiérarchisé décrivant un domaine d’activité • Référentiel : « processus énonciatif qui permet de différencier » • Descripteur : mot clé choisi parmi des synonymes pour les représenter • Différent des annuaires de termes : FishBase, LarvalBase, etc… • Chercheurs injoignables = Objectifs • Décrire les domaines d’activité de l’IRD • Faciliter la recherche • Offrir aux chercheurs les termes dont ils ont besoins PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : exemple = Thesaurus OECD (utilisé par l’IAM) PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : problèmes rencontrés (1/2) = Recherche de thesauri difficile • Confusion entre le terme « thesaurus » et l’objet « thesaurus » • Peu de thesauri libres et accessibles en ligne • Abus de langage et fausses pistes • Indisponibilité ou thesauri abandonnés = Droits d’utilisation • Thesauri soumis à des droits d’utilisation • Thesauri payants et non consultables PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : problèmes rencontrés (2/2) = Normalisation • Thesauri non normés • Fichier de termes non hiérarchisés = Précision • Thesauri non maintenus (mise à jour inexistante) • Manque de précision des thesauri : description souvent trop générale PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS = Dans MDweb • AGROVOC : terminologie agronomique (multilingue) • GEMET: terminologie environnementale (multilingue) • Toponymie : Terminologie géographique PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS = Quelques thesauri intéressants PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS = Granularité PRATLONG Léo – IRD Montpellier – 08/2007
THESAURUS : utilisation sur le portail = Mise à jour • Enrichir le recueil de termes • Actualiser le thesaurus • Permettre aux utilisateurs de personnaliser leur outil = Importation • Offrir un vaste choix de domaines • Ne compromet pas la stabilité du système • Possibilité d’évolution PRATLONG Léo – IRD Montpellier – 08/2007
Architecture de MDweb PRATLONG Léo – IRD Montpellier – 08/2007
ARCHITECTURE DU SERVEUR STOCKANT MDWEB PRATLONG Léo – IRD Montpellier – 08/2007
NORMES ET PROTOCOLES = Normes • Normes de métadonnées • ISO19115 • ISO19139 • Normes de thesaurus • RDF • SKOS • OWL = Protocoles • Protocoles de communication • Z3950 • CSW PRATLONG Léo – IRD Montpellier – 08/2007
NORMES = ISO19115 <cntOnlineRes> <linkage>http://www.ird.fr/</linkage> </cntOnlineRes> = ISO19139 <gmd:onlineResource> <gmd:CI_OnlineResource> <gmd:linkage><gmd:URL>http://www.ird.fr/</gmd:URL></gmd:linkage> </gmd:CI_OnlineResource> </gmd:onlineResource> PRATLONG Léo – IRD Montpellier – 08/2007
PROTOCOLES = Z3950 • Serveur Z3950 • Installation côté données • Effectue la requête sur la base de données qu’il relie • Client Z3950 • Inclus dans MDweb • Protocole Z3950 • Communication entre le client et le serveur Z3950 • Nécessité d’ouverture d’un port (2100, ici) = CSW • Version 1.6 de MDweb PRATLONG Léo – IRD Montpellier – 08/2007
ARCHITECTURE DE MDWEB : Besoins = Systèmes d’exploitation • Windows • Unix • Solution choisie : Serveur virtuel Linux CentOS sur machine distante = Besoin logiciel • Serveur Apache et serveur cartographique • Serveur Apache MapServer • Serveur de base de données • PostgreSQL avec extension PostGis PRATLONG Léo – IRD Montpellier – 08/2007
Installation de MDweb PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (1/3) = Webmin : portail web = Accès SSH : accès par un client (putty) = PhpPgAdmin : portail web = Netdrive : accès par client PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (2/3) = Webmin • Interpréteur de commandes shell • Accès restreint (absence de « vi ») • Interpréteur de commandes PostgreSQL • Commandes personnalisés • Activation / redémarrage des serveurs • Journal d’erreurs Apache / Php • Difficulté à repérer les erreurs instantanément = Accès SSH • Interpréteur de commandes Shell • Accès non restreint • Indispensable pour travailler en mode console PRATLONG Léo – IRD Montpellier – 08/2007
INTERFACES D’UTILISATION (3/3) = PhpPgAdmin • Interface de gestion de base de données PostgreSQL • Vue globale de la base = Netdrive • Interface de gestion de fichiers distants • Logiciel très instable • Interprète les fichiers Php inutilisable • Nécessité de renommer les fichiers *.php pour transférer • Met en péril la stabilité du reste du système PRATLONG Léo – IRD Montpellier – 08/2007
INSTALLATION DE MDWEB 1.5 = Inconvénients • Peu de docs • Documentation pour Windows mal adaptée à Linux • Bugs importants = Problèmes techniques • Réseau • Outils • Accès limité • Peu ergonomique PRATLONG Léo – IRD Montpellier – 08/2007
INSTALLATION DE MDWEB 1.5 : problèmes = Serveur Cartographique • Nombreuses erreurs (mapscript.so, fichiers introuvables, …) • Bug persistant : impossibilité de modification du style des shapes • Conséquences : installation très longue • Aucune documentation spécifique pour Linux = Serveur Z3950 • Documentation inexistante • Impossibilité d’exécuter la GUI d’installation installation impossible • Impossibilité de correction du code • Messages d’erreur peu explicites et illogiques PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE = Z3950 : résultats • Z3950 entre Mdweb et Géonetwork et entre Mdweb et Mdweb • Communication active entre un serveur et un client • Reçoit la réponse • Ne parvient pas à interpréter et afficher la fiche • NB : fonctionne de manière opérationnelle sur d’autres serveurs Unix (MTD) = Conclusion • Presque opérationnel • Installation peu facile PRATLONG Léo – IRD Montpellier – 08/2007
INTEROPERABILITE = CSW • Testé : CSW entre MDweb et Géonetwork • Implémentation du CSW nécessaire (version 1.6 encore instable, donc ici, Mdweb 1.5 enrichi du CSW) • Reçoit les métadonnées • Géonetwork renvoie du DublinCore : Mdweb ne l’interprète pas • Pas d’ouverture de port = Conclusion • Opérationnel • Technologie actuelle encore non adaptée (donc incompatibilité) PRATLONG Léo – IRD Montpellier – 08/2007
LIVRABLES = Documentation pour l’installation de Mdweb 1.5 sur serveur Linux CentOS = Installation de Mdweb1.5 sur serveur Linux CentOs = Documentation sur l’utilisation de MDweb = Documentation sur les thesauri = Thesauri PRATLONG Léo – IRD Montpellier – 08/2007
CONCLUSION = Mdweb : beaucoup de fonctionnalités, mais peu opérationnel = Interopérabilité possible : mieux vaut préférer le CSW = Installation de Mdweb sur serveur Linux peu pratique = Outil peu concurrentiel face à Geonetwork PRATLONG Léo – IRD Montpellier – 08/2007
PERSPECTIVES = Mdweb 2.0 : version Java avec installation facilitée et CSW = Standardisation du CSW aux autres outils PRATLONG Léo – IRD Montpellier – 08/2007