260 likes | 437 Views
Google Scholar Recherche Avancée . Chérifa BOUKACEM-ZEGHMOURI URFIST de Lyon Laboratoire Symme , 18 et 21 janvier 2013. Objectifs de la formation . Vous faire « découvrir » Google Scholar Volet RI Volet bibliométrique Vous donner un aperçu des pratiques
E N D
Google ScholarRecherche Avancée Chérifa BOUKACEM-ZEGHMOURI URFIST de Lyon Laboratoire Symme, 18 et 21 janvier 2013
Objectifs de la formation • Vous faire « découvrir » Google Scholar • Volet RI • Volet bibliométrique • Vous donner un aperçu des pratiques • Vous donner les clés pour exploiter au mieux Google Scholar dans une recherche • Connaître ses limites
Faire connaissance… • Moteur de recherche spécialisé dans la littérature académique et universitaire • Version Beta : Fin 2004, par Anurag ACHARYA • Numérisation de corpus de revues : fin 2007 • Gratuit et facile d’utilisation : point de départ • Concurrent des outils commerciaux : WOS, Scopus
Quel corpus ? • Type de documents : articles, pré-prints, rapports, thèse, livres, résumés,… • Articles : indexation des articles « peer-reviewed » • Indexation du texte intégral • Sources : Editeurs (ACS, après 2007), archives, sociétés savantes, … • Du libre et du payant à part égale • Langues : « plurilingue »…dominance de l’anglais • Disciplines : pluridisciplinaire • 7 grands domaines sur l’interface en anglais • Dominance STM, • SHS : moins bien représentées
L’OMERTA ! • Sources indexées • Couverture (qui varie en permanence) • Période couverte • Mise à jours (3 mois ?) • Indexation : PageRank et taux de citation • Quelques indices : 2007 : Accord avec Elsevier • Indexation du contenu de ScienceDirect • Mais aussi • Sociétés savantes, bibliothèques, revues en OA, universités, ,,,
Quid • De la validité des sources • Du statut des revues : A comité de lecture ou non • Des titres marginaux, peu connus, peu indexés • Des titres dans des langues minoritaires • Sélection ? Si oui, laquelle ?
Google Scholar et la France • HAL : Totalité • INIST : contrastée • ABES : contrastée • Google Books => BNF
Quelle présence dans les usages ? • PubMed, WOS, Scopus,… et les autres ! • La Googlisation • Compléments des grandes BDD • Les services et contenus associés • Localisation des contenus de bibliothèques • Une place de plus en plus importante
Chez les chercheurs ? • CV et Home Pages • De plus en plus de comptes personnels • Le volet bibliométrique est très apprécié • La santé, comme exemple
Une vitrine Dearcolleague, I am a researcherat a Max Planck Institute in Leipzig, Germany and one of the mostwidelycitedtheoreticallinguists of mygeneration (see http://scholar.google.de/citations?hl=en&user=JoLnQhwAAAAJ) Martin Haspelmath
Interfaces de recherche • Recherche simple • Dans la langue recherchée • Opérateur ET implicite • Pas de troncature • « » pour rechercher une expression • AutomaticStemming : Variations du mot, mais pas synonyme • Ignore la ponctuation • Ignore les articles et les mots communs • Recherche avancée • De plus en plus alignée sur les BDD commerciales • SD, WOS, emrald, … • Filtrage, sur la colonne de gauche
Zoom sur la recherche • Des fonctionnalités limitées • La recherche full-text se fait en langage naturel • Utiliser les termes scientifiques • Pas d’indexation matière, pas de thésaurus • Éviter les sigles, acronymes, … • Différences de résultats entre l’interface en anglais et en français • Information Overload et Filtres
« Préférences » Scholar • Langue d’interface • 20, dont le français • Langue de recherche • Pas de limite • Liens vers la bibliothèque • Si la bibliothèque a fait le nécessaire… • (Hartman, 2008) • Exporter les références vers un logiciel de gestion bibliographique • Paramétrage des résultats sur EndNote, RefWorks, BibTex, RefMan
Lancement d’une recherche • Sur le texte intégral des articles • Syntaxe fondée sur Google • Affichage des résultats par pertinence • Préférer l’interface anglophone qui sert de test aux fonctionnalités les plus avancées • Ne pas être surpris par des incohérences, confusions sur certains noms d’auteurs ou de titres d’articles
Décryptage des notices, lecture des résultats • Le type de document • La source • Le nombre de citations • Les versions • Les articles associés (related articles) • La localisation des documents • L’import des notices • Les fonctionnalités de filtrage
Comparaison des résultats Quelques exemples
Google Scholar, un média ? • Jamais de silence • Toujours « quelque chose » à proposer • Des services associés • Une exposition, une réception
Que fait Google Scholar de « Bibliométrique » ? • Il propose un ranking des résultats de la recherche qui est un “arbitrage” entre le contenu, l’auteur, le type de publication, et le nombre de fois où l’item a été cité dans la littérature … • Décryptage !
Démocratisation de la citation • Les corpus du WOS et de Scopus élargis • En type de documents (monographies, littérature grise,…) • En couverture linguistique : ex. le chinois • En couverture géographique : pays du sud, du tiers monde • Mix du libre et du payant • Possibilité d’analyses bibliométriques ? • « Scientificité » de la citation • Quelques critiques partagées avec WOS et Scopus (domaines, auteurs, exhaustivité, …) • L’antériorité du corpus : peut aller jusqu’au 18ème Siècle • Quid de la MAJ
Démocratisation de la citation • Pas le premier ! => ex : Scirus • Alternative, mais pas panacée • Un champ de recherche pour de nouveaux indicateurs • Un levier pour redimensionner les modèles économiques • Un enjeu pour les politiques d’évaluation
Variations du H-Index en fonction des disciplines • Informatique • WOS : 16 • GS :23 • Chimie • WOS :36 • GS : 22 • Management • WOS : 9 • GS : 13 • Médecine • WOS : 19 • GS : 19 • Sciences Sociales • WOS : 7 • GS :23 • Archéologie • WOS : 2 • GS :9 => Un complément …pas une alternative.
Faiblesse • La recherche par auteur (perfectible mais conditionnée) • Interface de recherche calquée sur Google • Absence de troncature et de parenthèses • Périmètre de résultats différents en fonction de la langue de l’interface recherchée • Date de publication pas toujours mentionnée • L’antériorité limitée au début du XXème siècle • En recherche de maturité • Classement par « Ranking » • Omerta et Algorithmes !!!
Avantages • Interdisciplinarité d’une recherche • Le langage naturel • Décloisonne les outils • Inclut les ressources des Universités • Élargit les résultats à d’autres types de documents que les articles • Augmente la visibilité de la littérature de recherche • Une source pour la littérature grise • Donne de la visibilité à la production des pays émergents • Propose un indicateur d’impact
Sources • Toutes les sources ayant servi à construire cette formation sont référencées au tag « google_scholar » de mon compte CiteUlike : • http://citeuilike.org/user/BOUKACEM/tag/google_scholar • Ce compte sera alimenté au fil de l’eau.