450 likes | 550 Views
Réseaux de lecteurs et outils de médiation ENSSIB – Mars 2014. Réseaux de lecteurs et outils de médiation. 1. Un réseau de lecteur : mécanique et contenus. 2. Analyse de la prescription de livres en ligne. 3. La recommandation automatisée de lecture. 4.
E N D
Réseaux de lecteurs et outils de médiation ENSSIB – Mars 2014
Réseaux de lecteurs et outils de médiation 1 • Un réseau de lecteur : mécanique et contenus 2 • Analyse de la prescription de livres en ligne 3 • La recommandation automatisée de lecture 4 • L’enrichissement d’OPAC en contenus 2.0
Réseaux de lecteurs et outils de médiation 1 • Un réseau de lecteur : mécanique et contenus 2 • Analyse de la prescription de livres en ligne 3 • La recommandation automatisée de lecture 4 • L’enrichissement d’OPAC en contenus 2.0
Premier site français sur le livre Première communauté de lecteurs Site numéro 1 en trafic 1 2 1,8 million de visiteurs chaque mois consultent les notices enrichies du site à la recherche de leur prochaine lecture 130 000 lecteurs membres partagent leurs lectures, critiques et citations
La communauté des grands lecteurs 1 130 000 lecteurs membres Une communauté de très grands lecteurs En tous genres Lecteurs lisant plus d’un livre par mois 96% 16% de la communauté Babelio de la population française (Source : Enquête de lectorat Babelio – juin 2011)
Une notice enrichie avec les informations bibliographiques de base et…
450 000 critiques de lecteurs Plus de 500 nouvelles par jour
La labellisation externe : 35 000 critiques de la presse généraliste et spécialisée Encore besoin des vieilles autorités littéraires
75 000 vidéos de partenaires (médias, INA, éditeurs etc.) associés aux auteurs
Réseaux de lecteurs et outils de médiation 1 Un réseau de lecteur : mécanique et contenus 2 Analyse de la prescription de livres en ligne 3 • La recommandation automatisée de lecture 4 • L’enrichissement d’OPAC en contenus 2.0
… origine de la majorité des découvertes de livres • Question : Diriez-vous que le bouche à oreille vous fait découvrir Une part nulle … de mes lectures Une part très importante Une part importante Une faible part La totalité Une faible part de mes lectures Pour 21% des lecteurs Au moins une part importante de mes lectures Pour 79,3 % des lecteurs Base lecteurs Babelio (942 int.)
Les auteurs les plus découverts par bouche à oreille Encore plus jeune… Pourriez-vous citer entre un et trois auteurs que vous avez découverts par bouche à oreille? Top 30 des auteurs, classés par nombre d’occurrences 1° Haruki Murakami 2° Maxime Chattam 4° Suzanne Collins 5° Jean Teulé 3° Franck Thilliez 11° Eric-Emmanuel Schmitt 10° Carlos Ruiz Zafon 9° Joël Dicker 8° Guillaume Musso 6° Katherine Pancol 7° Robin Hobb Et du 12° au 30° : George R R Martin,Katarina Mazetti , Stephenie meyer,Stieg Larsson, David Foenkinos , Henning Mankell,Ken Follett ,Carole Martinez ,Mary Ann Shaffer,Stefan Zweig,Anna Gavalda , Camilla Lackberg ,Fred Vargas ,Marc Levy ,Delphine de Vigan ,Amélie Nothomb , Barbara Constantine ,Bernard Werber ,Harlan Coben
Une forte présence des auteurs de genre Encore plus jeune… 1° Haruki Murakami 2° Maxime Chattam 4° Suzanne Collins 5° Jean Teulé 3° Franck Thilliez 11° Eric-Emmanuel Schmitt 10° Carlos Ruiz Zafon 9° Joël Dicker 8° Guillaume Musso 6° Katherine Pancol 7° Robin Hobb Et du 12° au 30° : George R R Martin,Katarina Mazetti ,Stephenie Meyer,Stieg Larsson, David Foenkinos ,Henning Mankell,Ken Follett ,Carole Martinez , Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg ,Fred Vargas , MarcLevy , Delphine de Vigan ,Amélie Nothomb , Barbara Constantine ,Bernard Werber,Harlan Coben
Des best-sellers de littérature générale 1° Haruki Murakami 2° Maxime Chattam 4° Suzanne Collins 5° Jean Teulé 3° Franck Thilliez 11° Eric-Emmanuel Schmitt 10° Carlos Ruiz Zafon 9° Joël Dicker 8° Guillaume Musso 6° Katherine Pancol 7° Robin Hobb Et du 12° au 30° : George R R Martin, Katarina Mazetti ,Stephenie meyer, Stieg Larsson, David Foenkinos,Henning Mankell, Ken Follett , Carole Martinez ,Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc Levy ,Delphine de Vigan ,Amélie Nothomb , Barbara Constantine ,Bernard Werber ,Harlan Coben
Des nouveaux auteurs découverts au premier roman 1° Haruki Murakami 2° Maxime Chattam 4° Suzanne Collins 5° Jean Teulé 3° Franck Thilliez 11° Eric-Emmanuel Schmitt 10° Carlos Ruiz Zafon 9° Joël Dicker 8° Guillaume Musso 6° Katherine Pancol 7° Robin Hobb Et du 12° au 30° : George R R Martin, Katarina Mazetti ,Stephenie meyer, Stieg Larsson, David Foenkinos ,Henning Mankell, Ken Follett , Carole Martinez ,Mary Ann Shaffer,Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc Levy ,Delphine de Vigan ,Amélie Nothomb ,Barbara Constantine,Bernard Werber ,Harlan Coben
Au-delà du top 30 : la longue traîne du BO 1157 auteurs découverts
Davantage de bouche à oreille positif que négatif • Il y a davantage de critiques de livres très positives que très négatives • Comparatif sur la base des critiques Babelio associées à une note de 5/5 (positive) ou 1/5 (négative)
Le BO sert plus à qualifier qu’à disqualifier un livre x 2,2 x 3,5 Les critiques positives sont jugées plus utiles que les critiques négatives
Réseaux de lecteurs et outils de médiation 1 Un réseau de lecteur : mécanique et contenus 2 Analyse de la prescription de livres en ligne 3 La recommandation automatisée de lecture 4 • L’enrichissement d’OPAC en contenus 2.0
Bookrank : algorithme de rapprochement de livres Statistique, sémantique, sociologique, Algorithmique? Capitalisme Désir et serviture La fabrique de L’homme endetté Après la crise Vivre la fin des temps Refaire société (Source : Google Analytics, mars 2012)
Quelles difficultés? 1 Pertinence qualitative Ex : GEB => Musique ? Logique? Intelligence artificielle? 2 Pertinence quantitative Ex : Favoriser la longue traîne? Rousseau => Voltaire ou Bachofen 3 Arbitrage sensibilité/précision Prendre des risques?
Quelles difficultés? 4 Data sparsity Qualification d’un nouvel entrant Livre avec peu d’infos/nouveautés 5 Scalabilité algorithmique Robustesse aux changements d’échelle 6 Performance 50 000 membres 2 millions de titres 3 millions de métadonnées …
Des problématiques propres au livre 1 Répétition d’auteur Titre de Kundera => Titre de Kundera? 2 Répétition de série/collections Gallimard Noire => Gallimard Noire ? 3 Thématiques semi-structurées BD/Essai/Roman … Besoin de mesurer les présupposés cognitifs du lecteur
Deux champs de R&D • Prime aux réseaux sociaux : captation de données • Nouveaux enjeux : structuration de métadonnées
Métadonnées qualifiées 2 1 Métadonnées descriptives Métadonnées d’usage • Lectures • Notes • Clics • Visites • Taux d’ajout, Etc. 3 4 Métadonnées non structurées Métadonnées structurées • Critiques • Extraits • Résumés • Titres • Taxinomie • Date • Nationalité • Ontologie, etc. (Source : Google Analytics, mai 2012)
Exemples de traitements de métadonnées Algorithmie classique / Statistique • Notation explicite/implicite • Clusters de populations • Corrélation statistique • Analyse qualitative prédictive Traitements sémantiques • Association des inflexions linguistiques : {roman, romans} • Association d’erreurs orthographiques : {cuisine, cuisne} • Association synonymique : {deuxième guerre mondiale, ww2} • Association thématique de premier ordre : {roman policier, polar et roman noir}
Traitement documentaire assisté (Source : Google Analytics, mai 2012)
Clusterisation algorithmique (Source : Google Analytics, mai 2012)
Algorithmes de filtrage 2 1 Filtrage CB Filtrage collaboratif Importance des notes, clusters de lecteurs «philosophie» => Musso «philosophie» => Schopenhauer Dimension temporelle 3 Réseau neuronal Feedback pertinence Identification des effets de bords Algorithmes autocorrectifs (Source : Google Analytics, mai 2012)
Réseaux de lecteurs et outils de médiation 1 Un réseau de lecteur : mécanique et contenus 2 Analyse de la prescription de livres en ligne 3 La recommandation automatisée de lecture 4 L’enrichissement d’OPAC en contenus 2.0
Un catalogue avec Babelthèque 1. Consultation et ajout de critiques 2.Consultation et ajout de citations 5.Critiques de professionnels 3.Recommandations de lecture précises sur 180 000 titres 6.Notes d’internautes 4.Etiquettes de classement, avec navigation dans le catalogue 7.Vidéos et podcasts d’auteur (entretiens, bandes-annonces etc.)
Les critiques de Babelio et d’usagers Fenêtre d’affichage des critiques de Babelio et d’usagers L’OPAC ne sera jamais un espace de contribution
La mise en avant des critiques de nouveautés Pour mettre en valeur les acquisitions et l’enrichissement du catalogue Un module pour afficher sur le portail les critiques des dernières acquisitions
Les étiquettes navigables de classement Un outil de navigation et de découverte utilisant le langage des usagers 4 500 000 étiquettes en janvier 2014 La zone étiquettes associées La zone « livres portant cette étiquette » Identification des étiquettes thématiques proches Les titres de votre catalogue portant cette étiquette Traitement documentaire et algorithmique des étiquettes pour améliorer la qualification des œuvres et la navigation dans le catalogue
Intégration transparente et contrôlée 1 - Intégration transparente, en marque blanche Sans logo Babelio, sans liens indésirables Extrait de la convention entre Babelio et la bibliothèque « En cas de cessation du service Babelthèque, la Bibliothèque Contractante pourra obtenir sur demande une copie sous format Excel de l’ensemble des contenus saisis par les usagers dans l’OPAC de la Bibliothèque Contractante via Babelthèque. La licence relative à ces contenus concédée à Babelio sera alors transférée à la Bibliothèque Contractante » 2 - La bibliothèque reste propriétaire des contenus générés dans l’OPAC 3 - Vos usagers contribuent directement dans l’OPAC Sans avoir besoin de s’inscrire sur Babelio
Découvrir Babelthèque Testez Babelthèque dans les catalogues de Nîmes et de Toulouse Portugal, de Cyril Pedrosa, à Nîmes Limonov, d’Emmanuel Carrère, à Toulouse http://goo.gl/tw6s5 http://goo.gl/YMZGs