510 likes | 652 Views
Veille documentaire en Sciences humaines et sociales. Lise Herzhaft – Urfist de Lyon Thomas Chaimbault - ENSSIB 14 décembre 2006 herzhaft@univ-lyon1.fr thomas.chaimbault@enssib.fr. Sommaire. 1. Les outils de veille 2. Une veille personnelle sur internet 3. Outils de veille collaboratifs.
E N D
Veille documentaire en Sciences humaines et sociales Lise Herzhaft – Urfist de Lyon Thomas Chaimbault - ENSSIB 14 décembre 2006 herzhaft@univ-lyon1.fr thomas.chaimbault@enssib.fr
Sommaire 1. Les outils de veille 2. Une veille personnelle sur internet 3. Outils de veille collaboratifs
1. Les outils de la veille 1.1 Objectifs de la veille 1.2 Etapes de la veille 1.3 Analyser et exploiter les résultats
1.1 Définition et objectifs • Activité de surveillance permanente de l'environnement interne ou externe d'une organisation qui doit permettre un repérage de signes ou d'indices révélateurs de changements importants. • Veille qui consiste en la collecte, le traitement et la diffusion de renseignements relatifs aux concurrents actuels et potentiels de l'entreprise, en vue de leur exploitation. • Veille qui consiste en la recherche, le traitement et la diffusion de renseignements sur la nature de la concurrence en vue de constamment étayer la prise de décisions, ce qui crée un avantage concurrentiel pour l'entreprise. • Activité de surveillance d'un environnement qui consiste à repérer les plus récents acquis technologiques et scientifiques, à évaluer les facteurs de risques et à collecter et traiter toutes les informations pertinentes susceptibles de rendre prospère une entreprise, une organisation, et ce, à court et à long terme. Note(s) :Les plus récents acquis technologiques et scientifiques peuvent être, par exemple, les nouvelles banques de données, les nouveaux brevets attribués et les agissements de la concurrence. AFNOR : Activité continue et en grande partie itérative visant à une surveillance active de l’environnement technologique, commercial … pour en anticiper les évolutions.
Processus ponctuel Recherche unique, plate Processus dynamique Itératif actualisé Importances des sources susceptibles de pertinence Recherche / veille Recherche traditionnelle du champ de recherche, du champ sémantique, des sources pertinentes, moteurs, annuaires, méta moteurs, sites de communautés, MAIS
Les écueils • Information manquante • (passoire, pas prise en compte des signaux faibles, de croisement des données…routinière) • Veille approximative • Information perdue, inaccessible (formats), non consignée • Mauvaise information non fiable, non pertinente, désinformation • Gaspillage de temps, de ressources, d’argent • Des outils difficiles à comparer/évaluer
1.2 Les étapes de la veille : Les acteurs, d’après Ghislaine Chartron
Le recueil des données • Faire le bilan des informations existantes • Trouver les sources pertinentes • Effectuer une première recherche • Créer une alerte ou s’abonner aux actualités (fils, messages)
Les sources • Catalogues de bibliothèques • Banques de données commerciales : personnalisables tant pour la recherche que pour les résultats (historique, favoris, alertes…) • Dépôts d’archives ouvertes • Thèses • Sites et moteurs spécialisés [cf Documentation française pour les rapports, In extenso pour SHS…] • Agendas d’évènements [Calenda] • Presse • Listes de discussion spécialisées, blogs et fils RSS • wikis
Exemple de fonctionnalités Lien vers un gestionnaire de citations Alertes par Mél ou fil RSS
Abonnement aux nouveaux titres d’un domaine choisi Sciences humaines droit
Les outils de collecte • Surveillance des fournisseurs de contenu avec les flux RSS (presse, portails spécialisés) Alertes sur une stratégie d’une BDD, une gestion de signets (Del.icio.us), un en semble de sites (rollyo.com), Copernic, Website watcher • Outils de crawling sur le web visible Verityou d’aspiration avec Autonomy , Wysigot • Outils de surveillance du web invisible et des bases de données • Crawlers évolués (réécrivent la requête) • Connecteurs traduisent la requête pour chaque source • Intégrateurs (Digimind Evolution) difficiles à paramétrer recherche/affichage des résultats complets ou non et génère un résumé à la volée! Regroupe les doublons et travaille sur de gros volumes de données
Alertes Google surréalisme Actualités ou Web ou Groupes Hebdomadaire ou en continu
Quelques outils du web invisible • Yahoo search subscriptions search.yahoo.com/subscriptions G/P • Gosh me www.goshme.com G • Incywincy www.incywincy.com G • Findarticles www.findarticles.com G/P • Google Scholar scholar.google.com G • Highwire Press www.highwire.org G/P • Scirus www.scirus.com/srsapp/ G
Quelques outils horizontaux • Répertoires de moteurs • allsearchengines www.allsearchengines.com(secteurs, technologies) • Finderseeker www.finderseeker.com(thématique) • Searchengine colossus www.searchenginecolossus.com par pays • Beaucoup www.beaucoup.com catégories • Répertoires de presse • Allnewspapers www.allnewspapers.com • Online newspapers www.onlinenewspapers.com • Giga press www.presse-on-line.com français
Quelques outils spécialisés • About.com http://about.com • Intute (ex RDN ) http://www.intute.ac.uk • Infomine http://infomine.ucr.edu/ • Bubl Link http://bubl.ac.uk/ • Invisible web net http://c.asselin.free.fr/french/webinvisible3.htm • LII.org Complete planet http://lii.org • Direct search www.freepint.orggary/directhtm • Internet public library www.ipl.org • Scout report http://scout.wisc.edu/Archives • OAISTER http://oaister.umdl.umich.edu/o/oaister/ • All info www.allinfo.com
Quelques blogs • Généralistes : • - Intute : http://www.intute.ac.uk/artsandhumanities/blog/ • - F. Briatte : http://phnk.com/blogosphere/universitaires • Disciplinaires : • - Droit : Servciedoc.info (S.Cottin), Precisement.org (Barthe) • - Histoire : Medievizmes (Zid) • - Linguistique : Technologies du langage (Jean Veronis) • - Littérature/SH : Blogofil (M. Pernoo - Becache) • - SHS : Blogo-Numericus (Marin Dacos) • - Sociologie : Baptiste Coulmont • - Sciences de l’information : INIST ; Affordance ; UrfistInfo ; Vagabondages ; It Ligentia • - Blogs d’établissements : BIUM ; Lausanne ; Buboblog (Brest) ; IUT Dijon
1.3 Analyser et exploiter les résultats • Etape très importante : L’erreur serait de ne pas utiliser les résultats de la veille. Le processus s’arrête souvent à la récolte, et faiblit au niveau de l’analyse et de la diffusion. • Mais les logiciels eux ont surtout traité ces aspects
Outils d’analyse Très perfectionnés • Extraction d’éléments pré définis (noms de personnes, produits, sociétés, lieux, nombres…) et méthodes linguistiques pour différentier les homonymies • Indexation thématique du sujet avec liste d’autorité ou thesaurus ou libre • Extraction d’éléments liés (personne/société) • Résumés automatiques • Classification, catégorisation Lexiquest, Verity • Extraction de connaissances • Cartographie • Solutions intégrées Autonomy, Arisem, Datops, Go Albert, Verity, DIGIMIND, Wysigot
Outils de traitement de l’information • On trouve deux méthodes d'analyse qui sont : • La bibliométrie qui permet une exploitation statistique des publications, elle permet d'identifier les acteurs impliqués et leur relation elle permet en outre d'élaborer des grilles de lecture des documents primaires, de rendre un suivi systématique des sciences, techniques et technologies de la concurrence, de mettre en place des signaux d'alerte permettant de détecter les mutations technologiques. • La scientométrie avec la méthode dite des co-citations et la méthode des mots associés (développé par l'école des mines dont sont issus beaucoup de personne ayant un lien avec la notion de veille technologique. • La scientométrie et la bibliométrie fournissent des logiciels pour analyser et synthétiser les informations issues de bases de données volumineuses : • Logiciel Dataview mis au point par Henri DOU. • Logiciel Leximappe développé par l'école des mines, il permet d'indexer automatiquement des informations spécifiques.
Diffuser des informations : pourquoi ? • Pour soi : • Aide à s’organiser • Se tenir au courant • Pour la communauté • Alerter les usagers • Alimenter une base de connaissance • Monter des formations • Mettre en place une revue de presse • Envoi des • bonnes informations • à la bonne personne • au bon moment • en toute sécurité
Diffuser de l’information : comment ? • Site spécifique • Lettre d’information • Blog • Fil RSS • Mél personnalisé • Listes de discussion • Forum de discussion • Wiki
2. Une veille personnalisée sur internet 2.1 La syndication de contenu 2.2 Agréger les flux RSS 2.3 S’abonner en ligne
2.1 La syndication de contenu Système où un producteur de contenu web met à la disposition des usagers un fichier texte structuré (format XML-RSS) comportant une description synthétique du contenu de son site et qui est régulièrement mis à jour. Un utilisateur peut ensuite récupérer de façon dynamique ce fichier pour le lire à l’aide d’un logiciel approprié (agrégateur) ou, s’il est webmestre, pour en faire afficher le contenu sur un site web On parle de : • fils RSS = liens RSS = flux RSS (RSS feeds) = canaux RSS (RSS channels) • Signets dynamiques (Live bookmarks) Un acronyme pour plusieurs significations: • Rich Site Summary (Sommaire de Site Enrichi) (RSS 0.91) • RDF Site Summary (Sommaire de site basée sur la norme RDF) (RSS 0.9, 1.0 et 1.1) • Really Simple Syndication (Syndication vraiment simple) (RSS 2.0)
Exemple de flux RSS Titre Lien Description
En l’absence de flux • En utilisant des outils spécifiques : Feed43, Ponyfish, FeedTier • En utilisant une option des agrégateurs : ex. WatchThatPage de Bloglines • En bas à gauche de l'interface Bloglines, on choisit l'option : Créer des Abonnements D'Email • On crée une adresse email pour chaque site qu'on veut surveiller, Bloglines génère alors directement un email de la forme : username.chiffres@bloglines.com • On crée par la suite un compte sur WatchThatPage avec l'email généré • On ajoute l'URL à surveiller • Donc, en final, les modifications du site surveillé sont insérées directement en RSS sur votre compte Bloglines.
2.2 Les agrégateurs de flux RSS • Un fichier XML mis à disposition par le producteur d’information. À l’aide d’un agrégateur, on s’abonne au fil RSS du producteur. L’ agrégateur fait régulièrement le tour de tous les fils et signale les nouveautés. Le résultat : une revue de presse personnalisée • Fonctionnalités de base: • Ajouter un fil, récupérer un fil automatiquement ou par copier/coller; • Possibilité d'exporter et d'importer les flux RSS, par liste (OPML); • Classer les fils dans des dossiers; • Signalement spécifique (couleur différente, nombre d’entrées) pour les fils non encore lus; • Paramétrage du taux de mises à jour des fils (globalement, par dossier, ou par fil). • Fonctionnalités avancées: • Archivage; • Recherche d’une occurrence dans un ensemble de fils; • Filtres; • Espions (Watches).
Exemple d’agrégateurs • Il existe des dizaines d'agrégateurs: pour Windows, pour MacOs et pour Linux, ou pour Palm. • En local FeedReader, pour Windows, qui est également gratuit et simple d'utilisation. Bloglines pour le web. • Des logiciels de messageries exploitent les flux RSS. Cf. Thunderbird ou Outlook (via des logiciels spécialisés). • Des navigateurs ont intégré cette fonctionnalité comme Firefox 2.0 ou IE7. • On peut ainsi créer sa page d’accueil personnalisée :Netvibes.
2.3 S’abonner : les blogs • Le terme vient de la contraction des termes « web » et « log » (en gros « bloc note sur le web »). • Le blog est un espace de publication régulière d’actualités généralistes, personnelles ou sectorielles datées, souvent construit sur le mode d’un journal intime et ne requérant aucune connaissance informatique particulière. Les billets, le plus souvent enrichis de liens externes, sont alors affichés selon un ordre chronologique inversé et susceptibles d'être commentés par les lecteurs. • le genre a conquis de nouveaux supports en mettant à profit la fonction multimédia du web : les images par les photo blogs, les vidéos avec les vidéo blogs, le son avec les podcats (ipod casting) et de plus en plus la téléphonie portable ou un PDA avec les moblogs (mobile + blog).
S’abonner aux blogs • Listes de blogs : • En Sciences de l’information : Bibliopédia • En SHS : AcademicBlogs, Liste de F.Briatte • Moteurs de recherche de fils RSS : • Feedster : <http://www.feedster.com > • Weblog compendium : <http://allrss.com/rssreaders.html> • Blogpulse : <http://www.blogpulse.com> • Blogsearch : <http://blogsearch.google.fr/ > • Technorati : <http://www.technorati.com/>
S’abonner : Les nouveautés des éditeurs • Science Direct – SD Title Alerts : nouveaux périodiques, modifiés, cessation de parution • Alertes sur les tables des matières de périodiques • Nature, Cambridge, Institute of Physics, Ingenta, BMJ Journals, American Chemical Society Publications, Oxford University Press, APA, AIP, PNAS, Science… • Relais vers le public = Univ. Saskatchewanhttp://library.usask.ca/ejournals/rss_vendors.php
S’abonner : Bases de données • Fil rss thématiqueex. “Curriculum Match” et “Dissertations & Thesis” de Proquest http://www.proquest.com/syndication/rss/rss.shtmlethttp://www.proquest.com/syndication/rss/disstheses.shtml
3. Outils de veille collaboratifs 3.1 Solutions en ligne 3.2 Utiliser les wikis 3.3 Solutions progicielles
3.1 Solutions en ligne • Partage de signets : Del.icio.us, Furl Les signets peuvent être catégorisés et visibles par d’autres usagers. En plus, Furl sauve une copie de chaque page sauvée la préservant de toute modification ou suppression. • Partage de références bibliographiques : ConnoteaCréé en déc.04 par le groupe Nature, Connotea a les mêmes fonctionnalités que Del.icio.us mais se destine principalement aux Chercheurs : dans le cadre de certains articles, il collecte ainsi automatiquement les métadonnées dont le nom de l’auteur et de la publication. Connotea utilise des catégories et attribue enfin des identifiants uniques lui permettant d’interagir avec des logiciels comme CrossRef. • Partage de bibliographies : Wikindx Système très complet destiné à la gestion et mise en commun de bibliographies, à la rédaction d'articles, etc. Vous pouvez entrer vos propres données, ou accéder aux bibliographies partagées par d'autres utilisateurs de WIKINDX sur Internet.
3.2 Les Wikis • système de gestion de contenu de site Web qui rend les pages Web librement et également modifiables par tous les visiteurs autorisés. Les wikis sont utilisés pour faciliter l'écriture collaborative de documents avec un minimum de contrainte. Le wiki a été inventé par Ward Cunningham en 1995, pour une section d'un site sur la programmation informatique qu'il a appelée WikiWikiWeb. Le mot « wiki » vient du terme hawaiienwiki wiki, qui signifie « rapide » ou « informel ». Au milieu des années 2000, les wikis ont atteint un bon niveau de maturité et sont associés au Web 2.0. Créée en 2001, l'encyclopédie Wikipédia est devenue le wiki le plus visité au monde. • La facile réécriture des pages fait des wikis de bons outils pour le travail collaboratif
Les Wikis : quelques exemples • Juridique : Jurispedia • Sciences de l’Info : Bibliopedia • Universitaire : RenéWiki (Paris5)
3.3 Solutions progicielles • Il y a de nombreux logiciels disponibles avec des fonctionnalités différentes (cf. CIGREF) • Outils: • AMI MI, • Kaliwatch Professional de Thales • KB Crawl de BEA Conseil • Fonctions : • Interfaçage avec des moteurs de sites divers • Extraction nécessaire TOUS les résultats des moteurs • Exploration de l’intégralité des réponses • Filtrage des doublons • Traitement de gros volumes de données
CIGREF 2006 Guide de recensement
2 exemples de logiciels de capture de sites Wysigot KB Crawl
Petite bibliographie • Revues : Regards sur l’IE, Veille • Site http://netchercheur.com/ • Blogs http://www.activeille.net/index.php • CIGREF. Guide de recensement des outils de collecte, de traitement et de visualisation de l’information. [En ligne] url : http://cigref.typepad.fr/cigref_publications/2006/08/index.html#entry-12065967 Janvier 2006.114 p. (consulté le 27/11/2006) • DIGIMIND. Découvrir et exploiter le web invisible pour la veille stratégique.[En ligne] url : http://www.digimind.com. Janvier 2006. 62 p.(Consulté le 24/11/2006) • FROCHOT, Didier. Dossier spécial: « Veille ».[En ligne]. url:http://www.defidoc.com/publications/dossierspecial_veille.htm . 2006 . 23 p.(consulté le 27/11/2006) • GFII. Outils de veille et d’IE : un référencement à partir des usages. [En ligne] 2006. http://www.gfii.asso.fr