1.99k likes | 4.04k Views
Les systèmes de recommandation. NEGRE Elsa Université Paris-Dauphine Elsa.Negre@dauphine.fr. Plan. Qu’est ce qu’un système de recommandation ? Les méthodes les plus utilisées Filtrage collaboratif Basée sur le contenu Hybride Quelques variations Un petit mot sur l’évaluation
E N D
Les systèmes de recommandation NEGRE Elsa Université Paris-Dauphine Elsa.Negre@dauphine.fr
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Un système de recommandation – Quèsaco? • Un système de recommandation (RS) aide les utilisateurs qui n'ont pas suffisamment d'expérience ou la compétence nécessaire pour évaluer le nombre, potentiellement important, d’alternatives offertes par un site (web). • Dans leur forme la plus simple les RS • recommandent à leurs utilisateurs des listes personnalisées et classées d'articles • fournissent aux consommateurs des renseignements pour les aider à décider quels articles acheter • Les articles peuvent être : • musique, livres, films, … • De manière générale, on parle d’items NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Un système de recommandation – Quèsaco? (2) • Problématique : estimation de scores pour des articles non encore évalués • Définition [Hill+:CHI’95] : • Soit • C : ensemble de tous les utilisateurs • S : ensemble de tous les articles possibles • u : fonction d’utilité d’un article s à l’utilisateur c • Alors, choisir l’article s’ non encore évaluéde S qui maximise l’utilité de chaque utilisateur c de C NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus utilisées • [La personnalisation - Personalized recommendations] • Le filtrage collaboratif – Collaborative filtering • Les recommandations basées sur le contenu – Content-based • Les approches hybrides NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus utilisées (2) Personalized recommendations NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus utilisées (3) Collaborative: "Dites-moi ce qui est populaire parmi mes pairs" NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus utilisées (4) Content-based: “Montrez-moi plus que ce qui ressemble à ce que j’ai aimé" NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les méthodes les plus utilisées (5) Hybrid: combinaisons de différentes entrées et/ou composition de différents mécanismes NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif Collaborative: "Dites-moi ce qui est populaire parmi mes pairs" NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif - Présentation • Les systèmes basés sur le filtrage collaboratif produisent des recommandations en calculant la similarité entre les préférences d’un utilisateur et celles d’autres utilisateurs • De tels systèmes ne tentent pas d’analyser ou de comprendre le contenu des items à recommander • Ils sont capables de suggérer de nouveaux items à des utilisateurs qui ont des préférences similaires à d’autres • La méthode consiste à faire des prévisions automatiques (filtrage) sur les intérêts d'un utilisateur en collectant des avis de nombreux utilisateurs (collaborateurs). L'hypothèse sous-jacente de cette approche est que ceux qui ont accepté (aimé qqch) dans le passé ont tendance à accepter (aimer qqch) de nouveau dans l'avenir. NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif - Mécanisme • Idée : • Essayer de prédire l'opinion de l'utilisateur qu’il aura sur les différents items et être en mesure de recommander le «meilleur» item à chaque utilisateur en fonction de : des goûts/avis précédents de l'utilisateur et des avis d'autres utilisateurs qui lui sont semblables • Mécanisme : • Un grand groupe de préférences d’utilisateurs sont enregistrées • Un sous-groupe d’utilisateurs est repéré dont les préférences sont similaires à celles de l'utilisateur qui cherche la recommandation • Une moyenne des préférences pour ce groupe est calculée • La fonction de préférence qui en résulte est utilisée pour recommander des options à l'utilisateur qui cherche la recommandation • La notion de similitude doit être définie d'une certaine façon NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
abcd abcd How it works User-to-User Item-to-Item How collaborative filtering works? “People who liked this also liked…” • Les recommandations sont faites en trouvant des utilisateurs ayant des avis similaires. Jane et Tim aiment tous les deux l’Item 2 et détestent l’Item 3; il semble qu’ils ont des avis similaires, ce qui suggère qu’en général Jane et Tim sont du même avis. Donc, l’Item 1 est une bonne recommandation pour Tim. Cette approche n’est pas adaptée pour des millions d’utilisateurs. • Les recommandations sont faites en trouvant les items qui ont le même intérêt pour plusieurs utilisateurs. Tom et Sandra aiment l’Item 1 et l’Item 4. Cela suggère que, en général, les utilisateurs qui aiment l’Item 4 aimeront aussi l’Item 1, donc l’Item 1 pourra être recommander à Tim. Cette approche s’adapte à des millions d’utilisateurs et des millions d’items. Item to Item User to User NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012 15 Source : Bracha Shapira
Filtrage collaboratif – Techniques utilisées • Similarité : • Pearson’s correlation coefficients between 2 users, • Cosinus similarity measure • SVD – Matrix Factorization • Sélection du voisinage • Neighbourhood-based algorithms (kNN, …) • Rating Prediction • LSA • Association rules • … NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif – Avantages • Utilise des recommandations d’autres utilisateurs (score) pour évaluer l’utilité des items • l'essentiel est de trouver des utilisateurs ou groupes d'utilisateurs dont les intérêts correspondent à l'utilisateur courant • Plus il y a d’utilisateurs, plus il y a de scores : meilleurs sont les résultats NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Filtrage collaboratif – Inconvénients • Trouver des utilisateurs ou groupes d’utilisateurs similaires est difficile • cold start problem – démarrage à froid • Nouvel utilisateur = Pas de préférences • Nouvel item = Pas de score • Faible densité de la matrice utilisateur/score • Évolutivité: • dans les systèmes avec un grand nombre d‘items et d'utilisateurs, le calcul croît linéairement; des algorithmes appropriés sont nécessaires • Portfolio Effect: Non Diversity Problem • Il n'est pas utile de recommander tous les films avec Antonio Banderas à un utilisateur qui a aimé l'un d'eux dans le passé • Sécurité • Privacy NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu Content-based: “Montrez-moi plus que ce qui ressemble à ce que j’ai aimé" NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu – Présentation • Pour les recommandations basées sur le contenu, le système essaie de recommander des items qui correspondent au profil de l'utilisateur. • Le profil est basé sur les items que l’utilisateurs a aimé dans le passé ou sur les intérêts qu’il a explicitement définis. • Un RS basé sur le contenu fait coïncider le profil de l’item avec le profil de l’utilisateur pour décider de sa pertinence pour l’utilisateur. NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu – Exemple User Profile update Read User Profile New books Match Recommender Systems recommendation 22 NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu - Techniques • Ces systèmes utilisent le plus souvent un algorithme de “machine learning” pour obtenir un profil des préférences de l’utilisateur à partir d’exemples basés sur une description du contenu. • … NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu – Avantages • Recommander des items similaires à ceux que les utilisateurs ont aimé dans le passé • Le profil des utilisateurs est la clé • Le matching entre les préférences de l'utilisateur et les caractéristiques des items fonctionne aussi pour les données textuelles • Pas besoin de données sur les autres utilisateurs. • Pas de problème de démarrage à froid ou de faible densité • Possibilité de faire des recommandations à des utilisateurs avec des goûts « uniques ». • Possibilité de recommander de nouveaux items ou même des items qui ne sont pas populaires NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Basée sur le contenu – Inconvénients • Tous les contenus ne peuvent pas être représentés avec des mots-clés (exemple: les images, …) • Des items représentés par le même ensemble de mots-clés ne peuvent pas être distingués • Les utilisateurs avec des milliers d'achats/items sont un problème • Nouvel utilisateur : pas d’historique • “Over-specialization” : limitation aux items similaires • Les profils utilisateurs… • Pour produire des recommandations précises, l'utilisateur doit fournir un « feedback » sur les suggestions retournées - les utilisateurs n'aiment pas… • Entièrement basé sur les scores d’articles et de sujets d'intérêt: moins il y a de scores, plus l’ensemble de recommandations possibles est limité. • Il faut faire attention à l’évolution des intérêts de l’utilisateur et les prendre en compte • Impossible d’exploiter les jugements des autres utilisateurs NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Hybride Hybrid: combinaisons de différentes entrées et/ou composition de différents mécanismes NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Hybride - Présentation • Combinaison du filtrage collaboratif et basé sur le contenu • 3 approches : • Monolitique • Parallèle • Pipeline NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Quelques variations… • Knowledge based RS • Utilise les informations des utilisateurs et des items • L'interaction conversationnelle est utilisée pour établir les préférences des utilisateurs : « plus comme ci », « moins comme ça », « aucun de ceux là », … • Cluster Models • Crée des clusters ou des groupes • Met un utilisateur dans une catégorie • La classification simplifie la tâche de “matching” entre utilisateurs • Plus d'évolutivité et de performances • Un peu plus précis que le filtrage collaboratif classique • Graph-based method • Principe de la propagation d’activité • Utilise les chemins de longueur > 3 pour recommander des items NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Evaluation des systèmes de recommandation • Mean Absolute Error (MAE) calcule l’écart entre les scores prédits et les scores réels. • Root Mean Square Error (RMSE) , similaire à la MAE, mais met l’accent sur les plus grands écarts • Rappel et précision • Le « rank score » est défini comme le rapport entre le score des items corrects et le meilleur score théorique réalisable pour l'utilisateur • … NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les systèmes de recommandation en BD et OLAP • Recommandations en bases de données : • Etant donnés : • Un log de requêtes • Une base de données • Une session courante • Soit • Q : ensemble de requêtes • S : ensemble de sessions • u : fonction d’utilité d’une requête q pour une session s • Alors choisir la requête q’ non encore évaluée de Q qui maximise l’utilité pour chaque session s de S NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les systèmes de recommandation en BD et OLAP (2) • Approches basées sur : • Exploitation du profil d’utilisation (Cuppens+:DSS’91, Jerbi+:DAWAK’09) • Analyse pilotée par la découverte (Sarawagi:VLDB’99-VLDB’00-VLDB’01, Cariou+:DAWAK’08, Giacometti+:IJDWM’09) • Exploitation du log de requêtes (Sapia:DMDW’99-DAWAK’00, Chatzopoulou+:SSDBM’09, Yang+:ICDE’09, Negre:09) NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Les systèmes de recommandation en BD et OLAP (3) • Requête : {Rouge}X{Centre, Limousin}X πAnnée(Temps)X{Montant} • Références : {<Montant, Rouge, Centre, 2007>, <Montant, Rouge, Limousin, 2007> <Montant, Rouge, Centre, 2008>, <Montant, Rouge, Limousin, 2008>} • Résultats : NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Exploitation du profil NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Analyse pilotée par la découverte NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Exploitation du log de requêtes NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Plan • Qu’est ce qu’un système de recommandation ? • Les méthodes les plus utilisées • Filtrage collaboratif • Basée sur le contenu • Hybride • Quelques variations • Un petit mot sur l’évaluation • La recommandation en BD et OLAP • Conclusion et perspectives NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Conclusion • Les systèmes de recommandation ont leurs racines dans de nombreux domaines de recherche : • Recherche d’information • Filtrage d’information • Classification de texte • … • Ils utilisent des techniques issues de différents domaines : • Machine learning • Data mining • … • Et abordent différents sujets : • Algorithmes de recommandation • Approches collaboratives, basées sur le contenu, hybrides, … • Evaluation des RS • … NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Perspectives • Amélioration des techniques de filtrage collaboratif • Utiliser plus de sources de données (tagging data, demographic information, and time data) • Combiner des techniques • … • Multicriteria recommender systems • Exploiter les scores multicritères qui contiennent de l’information contextuelle, pour améliorer les recommandations • Context awareness • Prendre en compte les aspects temporel, géographiques, … • Contexte émotionnel (“Je suis tombée amoureuse d’un garçon. Je veux voir un film romantique.") • … • Group recommendations • Améliorer les modèles d’interactions • Traitement du langage naturel, • Dialog-based systems for interactive preference, and • Passage des RS classiques aux “conseillers virtuels”. • Les techniques de recommandation vont fusionner avec d’autres champs de recherche • User modeling • Personalized reasoning • … • … NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012
Questions ? NEGRE Elsa - Systèmes de recommandation - Lens - 25/06/2012