1 / 36

Imaginez la situation suivante :

Ressources et outils de recherche sur le web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr. Imaginez la situation suivante :. Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un prochain projet, le responsable du labo vous demande :

tamas
Download Presentation

Imaginez la situation suivante :

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ressources et outils de recherche sur le webGabriel GallezotUniversité de Nice Sophia AntipolisURFISTgallezot@unice.fr

  2. Imaginez la situation suivante : Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un prochain projet, le responsable du labo vous demande : De produire une bibliographie sur de le thème de l'anthropocene De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. De surveiller un certain nombre de sites sur ce même thème et d'être attentif à l'image de l'organisme sur le web. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Intro Pull Push

  3. Plan Introduction générale à la recherche d’information Outils de recherche En Bu Sur le web Mon environnement de travail (selon déroulement) Methode Push

  4. 1Introduction générale à la recherche d’information

  5. L'accès à l'information Les "techniques intellectuelles" sont des méthodes et des outils ayant la capacité de repérer et de retrouver l'information ; Invariant ;-) Source : C. Fauré

  6. Repérage / indexation de d'information Référents externes Liste Taxinomie Thésaurus  Ontologie (graph) Référents internes métadonnées structures

  7. taxinomie / thésaurus / ontologie

  8. Index Le principe de stockage des informations dans l'index est celui d'un annuaire inversé : Chaque terme est associé a une liste de documents y contenant une occurrence -> critère de rapidité de recherche L'index stocke les informations sur les sources dans un format pivot : La richesse de ce format pivot, qui structure l'index, va être garante de la qualité de recherche. Source : C. Fauré

  9. Répères pour appréhender le Web 1991 (public) Tim Berners-Lee et Robert Cailliau Système métastable (métaphore du rocher), distribué et ouvert Pb du web : croissance rapide, création de désorientation du web classique => proposition d'un web sémantique (web de données) en 1994. Autres solutions en attendant le web de données Les moteurs Web 2.0 réseaux sociaux API (Application Programming Interface, web services)

  10. Pourquoi un moteur de recherche est-il si rapide pour chercher dans des milliards de pages ? Réponse : il ne cherche pas ! Il a déjà toutes les réponses aux requêtes qui lui sont formulées. Chaque requête est une métadonnée Source : C. Fauré

  11. Moteur de rechercheet texte mining Texte mining : art de générer automatiquement des métadonnées.=> plusieurs méthodes - Recherche « plein texte » (occurrences) - Recherche associative (statistique : les vecteurs) - Recherche linguistique (tokenisation, lemmatisation, entity extraction) - Recherche sémantique (structurée) : le moteur s'appuie sur des référentiels (à partir d'un référentiel métier par exemple) Source : C. Fauré

  12. Principe des moteurs Pour trouver de l'information, certes. Mais surtout pour : • trouver rapidement l'information • trouver de l'information dans des sources diverses et hétérogènes • rechercher dans des informations peu ou faiblement structurées

  13. Complémentarité des approches Source : C. Fauré

  14. Appréhension de l’info Source : Info@vis

  15. Matching : correspondance des mots-clés d’une requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, recommandation, etc) (monde des moteurs) et classements affinitaires personnalisés (monde des réseaux sociaux)>>>>> la question des algorithmes et des « outils de visualisation » de l'information

  16. http://www.davidgaliana.fr/medias-sociaux/infographie-60-secondes-sur-le-web/http://www.davidgaliana.fr/medias-sociaux/infographie-60-secondes-sur-le-web/

  17. Où chercher ? • Information contenue sur les ordinateurs individuels • plusieurs millions d’ordinateurs inter-connectés P2P • bases de données spécialisées • Contenu dynamique • Index partiel des sites • Interdiction d’indexation Web invisible (web profond) • + 1000 Milliards de Pages web ? • Forum de discussion Web visible et Web 2.0 (web surfacique) • Contenu indexable, • contenu taggé À partir de source : Eric Boutin

  18. Usages des moteurs 21 % du temps passé en ligne est consacré à la recherche 93 % des internautes utilisent les moteurs de recherche pour trouver et accéder aux sites 46 % des recherches concernent des informations sur des produits ou des services (e-commerce) 57 % des internautes cherchent sur le web chaque jour 50 % du trafic d’un site vient d’un moteur de recherche (France) Infographiclabs, 2010, GO-Gulf, 2012, Médiamétrie, 2012 Source : A. Bouchard

  19. Sites les plus visités Paul Jacionis, 05/2012 Source : A. Bouchard

  20. Nombre de requêtes Etude comScore, 2013 Source : A. Bouchard

  21. La personnalisation de la recherche « L’algorithme [de Google] utilise plus de 200 paramètres pour affiner une requête. Cela inclut le PageRank du site internet, la localisation géographique de l’internaute, les liens sur lesquels il clique généralement, la façon dont il modifie ses requêtes quand il n’est pas satisfait, ainsi que son historique de recherche » (T. Vanderbilt, 2013, voir également infographie) Personnalisation sur Google (étude A. Hannak et al., 2013) - 12 % des résultats différents - basée surtout sur l’identification au service et sur l’adresse IP (localisation)

  22. Les opérateurs(les booléens et les autres) OR AND AND NOT ( ) Formadoct : http://guides-formadoct.ueb.eu/content.php?pid=111868&sid=842560 link: site: filetype: allinurl: as_qdr=d15 Fonctionnalités : http://www.google.fr/intl/fr/help/features.html mais surtout de plus en plus d’interfaces à comprendre, à appréhender, à suivre, ... Exemple avec Google =>

  23. La Galaxie Google Google Trends (comparaison de termes, de sites) : http://trends.google.com Ex : http://www.google.org/flutrends/ Google Alerte : http://www.google.com/alerts Google Custom Search : http://www.google.fr/cse/ ... http://www.google.fr/intl/fr/options/ Google Knwoledge Graph :http://insidesearch.blogspot.fr/2012/05/introducing-knowledge-graph-things-not.html - Attention google and your memory : http://www.onlinecolleges.net/2011/09/19/google-and-your-memory/

  24. 2Les outils de recherche En Bibliothèque Sur le Web

  25. Ressources sur le web Exemples d’outils(panorama sur le web)

  26. Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Dictionnaires et les encyclopédies (Dico & Co) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (cf stage veille)

  27. Le « monde des bibliothèques » Catalogues Dédié aux thèses :http://www.theses.fr/ Worldcat http://worldcat.org/ JournalTOC : http://www.journaltocs.ac.uk/ Ne pas oublier Amazon, chapitre.com, decitre.. Bibliothèques Numérique Gallica : http://gallica.bnf.fr/ Europeana :http://www.europeana.eu/portal/ Hathi trust : http://www.hathitrust.org/ Wikisource : http://fr.wikisource.org/wiki/Wikisource:Accueil . Le projet Gutenberg (ebook): http://www.gutenberg.org/wiki/Main_Page . Internet Archive (le web) : http://www.archive.org/ . Google book : http://books.google.com/ . Liste des Bibliothèques numériques : http://www.science.gouv.fr/fr/bibliotheques-numeriques/ et http://signets.bnf.fr/html/categories/c_011textes_num.html

  28. Dico & Co Wikipedia : http://fr.wikipedia.org/wiki/Accueil Scholarpedia : http://www.scholarpedia.org/ CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance)http://www.cnrtl.fr/lexicographie/(accès à TLFI et d'autres dictionnaire)

  29. OA & Co HAL : http://hal.archives-ouvertes.fr/ Revues.org : http://www.revues.org/ Persee : http://www.persee.fr/web/guest/home/ OAIster (cf. Worldcat) : http://oaister.worldcat.org/ Base : http://www.base-search.net/ ISIDORE : http://www.rechercheisidore.fr/ OpenDOAR : http://www.opendoar.org/ Scientific commons http://www.scientificcommons.org/ DOAJ : http://www.doaj.org/

  30. Le web2.0Recherche « verticale » Signets : Diigo : http://www.diigo.com/, Delicious Ref biblio : CiteUlike http://www.citeulike.org/ , LibraryThing : http://www.librarything.com, Mendeley http://www.mendeley.com … Illustrations : Flickr http://www.flickr.com/ , youtube http://www.youtube.com/ , … : Présentations : PPT : http://www.slideshare.net Tweets : search de twitter et Topsy http://topsy.com/ Transversaux (avec choix) : Qwant, socialmention,...

  31. Les outils de recherche du web(quelques exemples) Moteurs « academics » Google scholar : http://scholar.google.com Microsoft academics search : http://academic.research.microsoft.com/ (voir aussi http://academic.research.microsoft.com/AcademicMap ) (ex avec UPF) Scirus : http://www.scirus.com JURN http://www.jurn.org/ (Google cse on directory of free journals) ... Cf aussi dia AO & co

  32. Les outils de recherche du web(quelques exemples - suite) MétaMoteurs Ixquick http://www.eu.ixquick.com/fra/ Clusty : http://clusty.com/ Interfaçage SearchCube : http://search-cube.com/ Oamos : http://www.oamos.com/ Moteurs de médias Vidéos : http://www.blinkx.com/ Images : http://www.picsearch.com/ Sur mobile phone Google googles Shazam, Soundhound ... « Verticaux » selon plateforme • choix du « vertical » : http://socialmention.com/ • Selon les droits associés : http://search.creativecommons.org/ Moteurs inversés Tineye : http://www.tineye.com/ Midomi : http://www.midomi.com Moteur collaboratifs : Blekko Moteur « anomysé » : Duckduckgo Moteur « vocal » : google sur chrome Recherche dans la vidéo : Voxalead : http://voxaleadnews.labs.exalead.com/ Moteur de réponses : Wolfram|Alpha, https://www.wolframalpha.com

  33. Outils “embarqués” : des extensions FireFox Tous les outils dans un menu déroulant Add to search : https://addons.mozilla.org/en-US/firefox/addon/3682 Ajout de fonctionnalités sur certain outils de recherche. ... “Sur mesure” : créer son moteur de recherche (ex : LeMien)‏ sur google custom search (ex co-op) , équivalent de l’opérateur site: multiplié à souhait : http://www.google.com/coop/cse/

  34. Exercices Je dois me déplacer à l'université de Nouvelle Calédonie, indiquez-moi la(es) références bibliographique(s) des ouvrages de Bruno latour, (postérieur à 2010) que je pourrai consulter sur place. Je souhaite me procurer l'article : Zalasiewicz, J., P.J. Crutzen, et W. Steffen. 2012. « Chapter 32 - The Anthropocene ». In The Geologic Time Scale, Boston: Elsevier, p. 1033-1040. Conseillez moi ! Je souhaite me procurer l'article : Slaughter, Richard A. 2012. « Welcome to the anthropocene ». Futures 44(2): 119-126.. Conseillez moi ! Sur Google, Je cherche des documents en pdf qui comportent le mot-clé « énergie » sur le site du « ministère de l'environnement ».(rédigez la requête) Sur Google, comment trouver des documents qui comportent le mot clés «anthropocene» et sont datés de 2011 sur le site de l'université de Nice Je cherche des images libre de droits pour illustrer mon cours sur «anthropocene » Je cherche des images similaires à http://grandquebec.com/upl-files/ours_polaire.jpg Quelle est la référence bibliographique originale du document comportant l'extrait suivant : […] La maîtrise de l’énergie mécanique a été le fait d’artisans et de techniciens souvent étrangers aux cercles scientifiques […]

  35. je souhaite lire l'ouvrage « l'origine des espèces » de C. Darwin comment faire ? Conseillez-moi. Je souhaite être averti par mail des nouvelles publications de la revue dont l'ISSN est : 1869-1099 ? Conseillez-moi. Quel est le titre de l’ouvrage dont l’isbn est : 9782343002538 Je cherche le document dont le titre est : « Conservation and social-ecological systems in the 21st century of the Anthropocene era ». Je cherche l'article de la revue « Nonprofit and Voluntary Sector Quarterly » de l'éditeur « Sage journals » intitulé « Volunteerism Research A Review Essay », Conseillez-moi. Je veux lire la totalité de l'ouvrage dont le titre est « The Pacific Northwest Research Station's biodiversity initiative [...] ». Conseillez-moi. Je souhaite avoir un aperçu des publications de Stevan Harnad, conseillez-moi Quelle est l'invention notable de Theodore Maiman ? conseillez-moi Exercices (suite)

  36. Vos questions ?

More Related