1 / 41

Folksonomies scientifiques : une étude exploratoire comparative

Folksonomies scientifiques : une étude exploratoire comparative. Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN. Objectifs généraux de l’étude. De quoi se composent les folksonomies scientifiques ?

dieter
Download Presentation

Folksonomies scientifiques : une étude exploratoire comparative

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Folksonomies scientifiques : une étude exploratoirecomparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN

  2. Objectifs généraux de l’étude De quoi se composent les folksonomies scientifiques ? • Une question : que révèlent les usages ? • Activité réelle des usagers dans et hors les groupes ? • Représentativité des domaines scientifiques ? • Méthodologie • Une entrée par les groupes • Une entrée par les tags 2

  3. Objectifs spécifiques de l’étude Quels groupes utilisent quels tags pour quels articles ? • Informations sur les groupes • Membres • Tags utilisés • Articles et/ou références répertoriés dans les bibliothèques des groupes • Dates (utilisateur et/ou article) • Analyses • Dynamique des groupes • Taille, âge des groupes, dernière arrivée d’un membre • Activité des groupes • Taille des bibliothèques, dernier article ajouté, • Tags associés aux articles • Analyse de contenu • Réseau de partage des tags par les groupes 3

  4. Protocole opératoire • Récupération des données à partir de pages HTML : • Scripts Perl • Module WWW::Mechanize qui peut : • décharger les pages HTML, • suivre les liens, • remplir les formulaires, • cliquer sur les boutons, • gérer les cookies, • mais ne peut pas interpréter JavaScript (exemple 2Collab) ! • (existe pour la plupart des langages : java, python, ruby, php ...) • Module WWW::RobotRules : • respect des consignes du serveur 4

  5. Protocole opératoire Récupération des données à partir d’une API : Sur certains sites comme Bibsonomy Scripts Perl Module WWW requête simple, syntaxe dépendante du site, résultat sous forme de fichiers XML, Module XML::TokeParser 5

  6. CiteULike 6

  7. Recherche des groupes URL : http://www.citeulike.org/groups/browse 7

  8. Recherche sur un groupe (1) URL : http://www.citeulike.org/group/22 8

  9. Recherche sur un groupe (2) URL : http://www.citeulike.org/group/22 9

  10. Recherche sur un groupe (3) URL : http://www.citeulike.org/groupfunc/22/members 10

  11. Recherche sur un groupe (4) URL : http://www.citeulike.org/group/22/article/1073937 11

  12. Résultats • Effectifs et dynamique des groupes • Activité des groupes • Tags utilisés par l’ensemble des groupes • Réseau d’un sous-ensemble : • 17 groupes partageant le tag « deforestation » 12

  13. CiteUlike : Effectifs des 2871 groupes Max 99 membres 1434 groupes d’un seul membre 13

  14. 2009 2005 2009 2006 21% 2004 2005 9% 37% 2008 2007 15% 17% 2006 2008 2007 Dynamique des groupes Année de création 6% 38% 11% 14% 31% dernier membre ajouté 14

  15. Le groupe contenant le + d’inscrits Bioinformatics • Groupe libre • 99 membres • Crée le 10/10/2007 • Dernier membre ajouté le 06/08/2009 • 3 769 articles • Dernier article ajouté le 18/09/2009 • Description : Analysis and modelling of molecular biology data 15

  16. Activité des groupes Max 27 741 articles 236 groupes avec un seul article 524 groupes sans articles 16

  17. 2009 2005 2009 2006 6% 38% 11% 33% 14% 2007 18% 2008 2005 31% 23% 3% 2006 2008 2007 7% 15% Activité des groupes dernier membre ajouté dernier article ajouté 17

  18. Le groupe contenant le + d’articles Le plus gros groupe n’est géré que par 2 utilisateurs. Il est actif depuis plus d’un an et est mis à jour très régulièrement C. elegans /WormBase • Groupe libre • 2 membres • Crée le 02/08/2008 • Dernier membre ajouté le 17/09/2008 • 27 741 articles • Dernier article ajouté le 14/09/2009 • Description : • Articles of note for the nematode research community in general and the C. elegans community in particular. 18

  19. Les groupes de 1 membre Plus de 350 groupes d’un seul membre ne contenant pas d’article TESTS ???? Nb groupes Nb articles 19

  20. Les groupes sans article Un groupe de 14 membres sans articles Nb groupes Nb membres 20

  21. Les groupes avec 1 seul article 150 groupes constitués d’un seul membre ont un seul article TESTS ???? Nb groupes Nb membres 21

  22. Tags de l’ensemble des groupes • 68 522 tags • 26 668 tags de fréquence 1 • 43 820 tags dans un seul groupe 22

  23. Les tags les plus fréquents Le vocabulaire du plus gros groupe en terme d’article (27741) se retrouve dans ce classement (C. elegans /WormBase ) 23

  24. Répartition des tags par groupe 24

  25. Les tags partagés par les groupes 25

  26. Le réseau « deforestation » 26

  27. Le réseau « deforestation » 27

  28. Une bibliothèque pour 3  groupes • Tags : • bibtex-import • Species • Habitat • Spatial • Control • Management • Biodiversity • Conservation • Population • Diversity • Biological • Litchi • Mode • Plant • 45 landscape • Botany • taxonomy, evolution, physiology, ecology, genetics • 11 utilisateurs, • 1862 articles, • Créé en 2007, • dernier utilisateur en 08/2009 • dernier article en 06/2007 • 2938 tags • EarthEnvironmentalSciences • Major researches on various environmental, ecological, socio-economic, geographical, biodiversity issues. From earth climate change to minute soil pores studies. From microbiotic crusts to Amazon forest study. From polar ice caps to Sahara desert. • 12 utilisateurs, • 1862 articles, • Créé en 2008, • dernier utilisateur en 08/2009 • dernier article en 06/2007 • 2938 tags • Entomology • taxonomy, ecology, conservation, evolution, physiology, genetics • 10 utilisateurs, • 1862 articles, • Créé en 2007, • dernier utilisateur en 09/2009 • dernier article en 06/2007 • 2938 tags 28

  29. Bibsonomy 29

  30. Recherche des groupes 30

  31. Recherche sur un groupe (1) BIBLIOTHEK 2.0 Séparation url (bookmarks) et publications (notices)

  32. Effectifs des 169 groupes 85 groupes de zéro membre ???????? Particularités de ce logiciel le 1er membre donne son nom au groupe et n’est pas compté Max 47 membres pour le plus grand groupe

  33. Dynamique des groupes Année de création dernier article ajouté 50% des groupes sont mis à jour depuis janvier 2010

  34. Les tags les plus fréquents TAG automatique

  35. Connotea

  36. Connotea

  37. Groupes

  38. 2collab 38

  39. 2collab 39

  40. Conclusion - Perspectives • Premières analyses exploratoires • Analyse guidée par les groupes et les tags • Réseaux de groupe par tags partagés • Profils des groupes • Une activité différenciée dans les groupes • Des testeurs en nombre (groupes de 1 personne) • Des petits groupes très actifs (2 personnes) • Des groupes qui continuent de croître sans activité de tagging • Des longues traines de tags 40

  41. Conclusion - Perspectives • Les domaines représentés • Les groupes représentant les domaines • Reste à évaluer • Le poids de l’activité des individus hors groupes • Le poids des références importées des autres serveurs (recoupements) 41

More Related