250 likes | 400 Views
Réaliser un import XML. Estelle.Theveniaud@ccsd.cnrs.fr. Sommaire. Présentation Les différentes étapes Consulter les référentiels de HAL Quelques conseils Construire son fichier Exemple de fichier xml. Présentation. Permet le dépôt rapide de lots d’article
E N D
Réaliser un import XML Estelle.Theveniaud@ccsd.cnrs.fr
Sommaire • Présentation • Les différentes étapes • Consulter les référentiels de HAL • Quelques conseils • Construire son fichier • Exemple de fichier xml
Présentation • Permet le dépôt rapide de lots d’article • Facilite le transfert d’articles d’une base à une autre • Pour utiliser l’import XML: • Disposer d’un compte sur HAL • Demander l’autorisation au CCSD (hal.support@ccsd.cnrs.fr) 3
Les différentes étapes • Créer un fichier XML validé par le schéma XML de HAL • Créer un fichier compressé avec le fichier XML et les documents correspondants au texte intégral Depotscomplets.zip • mesdepots.xml • depot1.pdf • depot2-1.pdf (fichier_principal) • depot2-2.pdf 4
Les différentes étapes • Importer le fichier à cette url : http://import.ccsd.cnrs.fr • Le schéma n’est pas validé : corriger le fichier et recommencer • Le schéma est validé : affichage des identifiants et mots de passe du dépôt • Les dépôts sont visibles dans votre espace « mes documents en attente d’être déposés » • Valider les dépôts • Les dépôts suivront le même processus que les dépôts faits par l’interface 5
Consulter les référentiels de HAL • Récupérer l’identifiant d’un laboratoire • Récupérer le nom d’un journal • Récupérer le code d’un domaine • Accès au référentiel : http://import.ccsd.cnrs.fr/ref.php 6
Quelques conseils • Créer un fichier avec seulement une notice ou un article pour faire un premier test • Si c’est un dépôt avec texte intégral ne pas oublier de joindre le fichier correspondant ou de préciser le lien • Consulter les référentiels de HAL pour récupérer les données nécessaires (code de domaine, identifiant de laboratoire, nom de journal) • Par mesure de précaution nous n’autorisons aujourd’hui que les imports de petits lots d’articles (limité à 30) 7
Construire son fichier • Balise racine <NOM_INSTANCE> • Balise <CONNEXION LOGIN=‘xxx’ PASSWORD=‘…’/> • Balise <ARTICLE_RECENT> ou <NOTICE> • <META_ART> ou <META_ART_NOTICE> • <DATE_REDACTION> • <DEPOTS> (optionnel pour le dépôt de notice) • <TAMPONS> (optionnel)
Construire son fichier • Balise <META_ART> • <LANGUE> • <ABSTRACT> • <DOMAIN> • <TITLE> • <ABSTRACT_ML> • <WRINTING_DATE> • <SSTITLE> • <ID_EXT> • <CLASSIFICATION> • <DATEVISIBLE> • <REFERENCE_BIBLIO> • <BIBCODE> • <COMMENT> • <COLLABORATION> • <KEYWORD> • <FINANCEMENT> • <PROJETANR> • <PROJETEUROPE>
Construire son fichier • Balise <REFERENCE_BIBLIO> • <ART_ACL> : Articles dans des revues à comité de lecture • <ART_SCL> : Articles dans des revues sans comité de lecture • <COMM_ACT> : Communication avec actes • <COMM_SACT> : Communication sans acte • <CONF_INV> : Conférences invitées • <OUVS> : Ouvrages scientifiques • <COVS> : Chapitres d’ouvrages scientifiques • <DOUV> : Directions ouvrages • <PATENT> : Brevets • <OTHER> : Autres
Construire son fichier • Balise <ART_ACL> : Articles dans des revues à comité de lecture • <DATEPUB> • <DATEEPUB> • <JOURNAL> • <VOLUME> • <ISSUE> • <PAGE> • <DOI> • <AUDIENCE>
Construire son fichier • Balise <ART_SCL> : Articles dans des revues sans comité de lecture • <DATEPUB> • <DATEEPUB> • <JOURNAL> • <VOLUME> • <ISSUE> • <PAGE> • <DOI>
Construire son fichier • Balise <COMM_ACT> : communications avec actes • <TITOUV> • <TITCONF> • <DATEPUB> • <DATECONF> • <DATEFINCONF> • <EDCOM> • <EDSCI> • <VOLUME> • <ISSUE> • <PAGE> • <DOI> • <AUDIENCE> • <PAYS> • <VILLE> • <SERIE>
Construire son fichier • Balise <COMM_SACT> : communications sans actes • <TITCONF> • <DATECONF> • <DATEFINCONF> • <PAYS> • <VILLE>
Construire son fichier • Balise <CONF_INV> : conférences invitées • <TITOUV> • <TITCONF> • <DATEPUB> • <DATECONF> • <DATEFINCONF> • <EDCOM> • <EDSCI> • <VOLUME> • <ISSUE> • <PAGE> • <DOI> • <AUDIENCE> • <PAYS> • <VILLE> • <SERIE>
Construire son fichier • Balise <OUVS> : ouvrages scientifiques • <DOI> • <EDCOM> • <EDSCI> • <DATEPUB> • <DIRCOLL> • <PAGE>
Construire son fichier • Balise <COVS> : chapitres d’ouvrages scientifiques • <DOI> • <TITOUV> • <EDCOM> • <EDSCI> • <DATEPUB> • <PAGE> • <SERIE>
Construire son fichier • Balise <DOUV> : directions d’ouvrages • <DOI> • <EDCOM> • <DATEPUB> • <PAGE>
Construire son fichier • Balise <OTHER> : Autres publications • <DOI> • <DATEPUB> • <PAGE> • <DESCRIPTION>
Construire son fichier • Balise <AUTLAB> : Affiliation auteur-laboratoire • <AUTEURS> • <AUTEUR> • <LABIDS> • <NOM> • <PRENOM> • <EMAIL> • <URL> • <ORGANISM> • <RESEARCHTEAM> • <LABORATOIRES> • <LABORATOIRE> • <LABID> • <SIGLE> • <INTITULE> • <PAYS> • <ADRESSE> • <AFFILIATIONS> • <AFFILIATION> • Si le laboratoire est connu => Labid • Sinon => Labid = ‘L1’ + SIGLE + INTITULE +…
Construire son fichier • Balise <DEPOTS> : Texte intégral • <RIGHT> • <FULLTEXT> • <DEPOT> • NOM • FORMAT • FULLTEXT • FICHIER_PRINCIPAL • <RIGHT> peut avoir pour valeur: • 1=> Les fichiers que je dépose sont des fichiers auteur • 2=> Cet éditeur fait partie de ceux qui autorisent le dépôt des "fichiers éditeur" sur une archive ouverte • 3=>J'ai obtenu l'accord explicite de cet éditeur pour ce dépôt particulier
Construire son fichier • Exemple de dépôt avec texte intégral
Construire son fichier • Balise <TAMPONS> : Tamponner le dépôt dans une collection • <TAMPON> • TAMPID
Exercice • Compléter le fichier xml en récupérant les informations manquantes dans le fichier mentionné dans la balise de dépôt. • Le fichier xml est disponible à cette url : http://www.ccsd.cnrs.fr/ANF2012/import_fichier.xml