240 likes | 352 Views
La communauté comme indexeur. .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon. Université de Nantes. .Laboratoire DOCSI. http://www.affordance.info . Définition. « Folksonomies désignent un processus de classification collaborative par des mots-clés librement choisis
E N D
La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon. Université de Nantes. .Laboratoire DOCSI. http://www.affordance.info
Définition • « Folksonomies désignent • un processus de classification collaborative • par des mots-clés librement choisis • Ou le résultat de cette classification. » (Wikipédia)
≠ thesaurus • « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »
≠ ontologie • « ensemble structuré de concepts. (…) • organisés dans un graphe (…) • relations sémantiques et de composition ou d'héritage. »
Folksonomie ≠ thesaurus ≠ ontologie • « Folksonomies désignent • un processus de classification collaborative • par des mots-clés librement choisis • Ou le résultat de cette classification. » • Vocabulaire non-normalisé, • non-structuré, • non-spécifique à un domaine, • sans relations sémantiques ou hiérarchiques.
5 étapes d’indexation Web Standardisation GOOGLE PageRank « Indexeurs sans le savoir » <META> Communauté de pratique • DUBLIN-CORE • OAI-PMH • Communauté • Métier / Ressources Linguistique de corpus FOLKSONOMIES Communauté D’usage ? • Web • Sémantique ONTOLOGIES Communauté compétences (Outils + métier) ?
Quoi ? Qui indexe ? Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres Usagers, Consommateurs, Producteurs, Auteurs, Novices, Experts. Organiser, Partager, Chercher, Retrouver Associer, « Participer » A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics) Comment ? Pourquoi ?
? Avantages = Inconvénients ? • Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite • Intérêt d’un filtrage collaboratif • gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … • Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …) • Conforme aux usages (onebox, oneword) • Trop simple, trop peu d’expertise, trop d’hétérogénéité • Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) • polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) • = Méta-bruit
? Avantages = Inconvénients ? • « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » • Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. • Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. • Mais sur les objets ? • Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ? • Doit-on décider qu’elles sont inclassables ??
Temporalité réunifiée entre interface et indexation La fonction symbolique plutôt que la vocation analytique. Sagesse des foules Auto-régulation Faible coût cognitif (enfin une) Indexation orientée-tâche Les raisons du succès 1 2 3 4 5 6
Folksonom’IST & Bibliothèques • http://www.librarything.com • Indexation « standard » : notice au format MARC, indexation DEWEY, LC "subjects headings », • + indexation sociale : des tags associés, des fiches de lecture et revues de la communauté, système de recommandation • Bibliothèque & Catalogue http://tags.library.upenn.edu/ • Intégration dans SIGB • (open source ou propriétaires) • Bibliothéconomie « de masse » ?
Folksonom’IST & Bases de données • Meilleur des deux mondes ?
Folksonom’IST & communautés scientifiques • Postgenomic.com • Repérage de signets IST (CiteUlike) • Folksonomies présentes partout • (accès, repérage, commentaire des ressources IST)
Folksonom’IST & Moteurs • Plusiers « écoles » • Moteurs dédiés (technorati.com) • Fonctionalité intégrée (MyYahoo) • Illusion folksonomique (cloud.clusty.com)
Vers des modèles hybrides ? • Amazon : « Collaborative structured tagging » = Amapedia • Tags factuels • TagFactuel : valeur1, Valeur2, Valeur3 ... • Tags catégoriels • Relation « is a » • Relation « like … » • Relation « partage des attributs essentiels »
Vers des modèles hybrides • FlickR (& bientôt) Del.icio.us : « Machine Tags » • flickr:user=straup • flora:tree=coniferous • medium:paint=oil • geo:cartier="plateau mont royal" • geo:neighbourhood=geo:cartier • Nom : attribut = valeur.
Intérêt « fusionnel » • Exporter … • Vers un site collaboratif communautaire (del.icio.us) • Des (méta)données documentaires (HubMed) http://hublog.hubmed.org/
Problématiques ouvertes • « indexabilité » de l’actuelle masse documentaire (dans laquelle tout est document, y compris … nous) • Bibliothéconomie de masse • Horizon de l’indexation : • Question n’est plus celle de l’autorité (qui a autorité pour indexer) • ni même de l’expertise (qui a compétence pour indexer), • mais celle de l’usage (qui a besoin d’indexer).
Conclusion … • «It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing. » • Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006. • La communauté comme indexeur a son rôle à jouer. • Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique
… MeRci … ? QuEsTioNs ? ? QuEsTioNs ?