1 / 25

Navigation visuelle personnalisée dans des masses de données Visualisation du jeu de données IMDB

Navigation visuelle personnalisée dans des masses de données Visualisation du jeu de données IMDB. Romain Vuillemot LIRIS. Plan de l’exposé. Navigation personnalisée dans des masses de données Modèle de représentation visuelle Plateforme de tests VizOD Cas du jeu de données IMDB

Download Presentation

Navigation visuelle personnalisée dans des masses de données Visualisation du jeu de données IMDB

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Navigation visuelle personnalisée dans des masses de donnéesVisualisation du jeu de données IMDB Romain Vuillemot LIRIS

  2. Plan de l’exposé Navigation personnalisée dans des masses de données • Modèle de représentation visuelle • Plateforme de tests VizOD Cas du jeu de données IMDB • Une visualisation du jeu de données • Personnalisation • Concours InfoVis’07 ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  3. Plan de l’exposé Navigation personnalisée dans des masses de données • Modèle de représentation visuelle • Plateforme de tests VizOD Cas du jeu de données IMDB • Une visualisation du jeu de données • Personnalisation • Concours InfoVis’07 ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  4. Présentation • 2006-2009 : Allocataire moniteur LIRIS/INSA Lyon • Encadré par Béatrice Rumpler & Jean-Marie Pinon « Navigation personnalisée dans de grands ensembles de documents : Modèle et représentation visuelle » • But :améliorer l’accès visuel à de grands ensembles de données • Idée :réutiliser la connaissance du profil utilisateur dans la présentation et l’interaction avec les résultats ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  5. Exemple • Présentation linéaire par pagerank décroissant http://www.google.com http://www.kartoo.com ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon • Cartographie 2D sémantique des résultats

  6. Modèle de représentation des données [ VRP07 ] Romain Vuillemot, Béatrice Rumpler, et Jean-Marie Pinon. L’hyper-accès au moyen du profil utilisateur. A paraître dans h2ptm’07 : Collaborer, Échanger, Inventer : Expériences de réseaux, Octobre 2007, Hammamet, Tunisie. • Extraction • Indexation/structuration des données, requêtes d’interrogation, transformation en structure interne, .. • Disposition • Représentation dans un espace 2D/3D/hyperbolique, colorisation, ajout de symboles.. • Rendu • Support de rendu (image, vidéo), cadre applicatif, interactions.. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  7. Réutilisation du profil utilisateur • Réutilisation du profil/connaissances de l’utilisateur : • Choix de la disposition et de la représentation • Réseau, arbre, position spatiale, couleurs, symboles,.. • Choix du rendu • 2D/3D, cadre applicatif, .. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon Profils

  8. Réutilisation du profil utilisateur • Réutilisation du profil/connaissances de l’utilisateur : • Choix de la disposition et de la représentation • Réseau, arbre, position spatiale, couleurs, symboles,.. • Choix du rendu • 2D/3D, cadre applicatif, .. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon Profils Rôle du serveur de tests VizOD

  9. VizOD : serveur de tests • « Visualization-On-Demand » • Serveur de test • Reprend le paradigme du on-demand(choix de librairies graphiques, structures de données, ..) permettant la personnalisation. • Capitalisation • Connaissances (évaluations, design, ..) • Traces d’utilisation • Temps de calculs. • Installation (en cours) de librairies • Proviennent de nombreux domaines : informatique, biologie, chimie, .. qu’il faut homogénéiser. • Exmples : LGL (Java), Graphviz (C++) , Tulip (C++) ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  10. VizOD : architecture • Architecture : • On centralise ce qui demande du temps • Construction de la structure de représentation • Disposition (spatialisation) de la structure • On décentralise ce qui demande de la réactivité • Reformulation de la disposition • Rendu/Point de vue sur les données • Résumé : on génère des images que l’on réinjecte dans l’environnement applicatif de l’utilisateur ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  11. VizOD : architecture ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  12. VizOD : perspectives • D’un point de vue technique • Identifier les choix de personnalisation (librairies, métaphores visuelles, ..) • Identifier et définir les stratégies d’intégration dans des cadres applicatifs • Augmenter l’exhaustivité en général • Définir des critères de personnalisation • Similarités avec les profils de sélection (construction, structure du profil, ..)? • Définition d’un profil visuel? • Vers un profil commun? ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  13. Plan de l’exposé Navigation personnalisée dans des masses de données • Modèle de représentation visuelle • Plateforme de tests VizOD Cas du jeu de données IMDB • Une visualisation du jeu de données • Personnalisation • Concours InfoVis’07 ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  14. Représentations existantes • Visualisation analytique • Spotfire : outil d’analyse permettant de répondre à des scénarios ou en faire émerger • Users who watch all the most popular movies do not like other movies as much ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon http://www.spotfire.com/ • Strangers can recommend movies to each other! • Peu performant dans le cas de MDD • Nécessité d’utiliser d’autres formes de représentation (métaphores visuelles) et d’ interaction ( post-Wimp, multimodale, ..)

  15. Une visualisation de IMDB • Base de données IMDB (24 tables, 25k à 4,5M de champs). Peut-on avoir une vue quantitative sur les données? • Par exemple sous forme d’arbre : une racine artificielle, chaque fils sera une table et chaque feuille une entrée dans la table • Répond à la question : quelle est la proportion des différentes tables? • Etapes de représentation visuelle • Requêtes d’extraction des données (SELECT ALL ..) • Construction d’un arbre (ajout d’une racine artificielle) • Conversion en GML (Graph Modeling Language) • Disposition avec LGL (Ajout de composantes spatiales au graphe) par auto-organisation. • Rendu avec LGL (Conversion du graphe spatialisé en image) • Affichage ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  16. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon Résolution : 1/10 000ème Temps de calcul : 39s Machine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) doté de 512 KB de mémoire cache. Librairie LGL.

  17. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon Résolution : 1/1000ème Temps de calcul : 374s Machine : Linux (distribution Fedora/Red Hat 4.0.2-8) avec un noyau 2.6.16, 512 Mo de Ram, un processeur AMD AthlonTMXP 2500+ (1.8 GHz) doté de 512 KB de mémoire cache. Librairie LGL.

  18. Analyse de la représentation • Aspects positifs • On a une vue globale et immédiate • Mais uniquement quantitative • Utilisation des capacités de l’être humain : • Clustering, classification, .. • Ne requiert pas de lourd apprentissage • Aspects négatifs • Pas temps réel : attente par l’utilisateur • Anticiper le comportement de l’utilisateur • Navigation difficile • Identifier les ressources disponibles (écrans, espaces, ..) • Il faut coordonner! • BILAN : définir une stratégie (objectif , qualité de résultat, ..) en identifiant le contexte d’usage (ressources d’interaction disponibles, environnement) : utiliser le profil utilisateur. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  19. Exemples de personnalisation • Disposition: • Couleurs des arêtes : historique en rouge • Icônes sur les sommets : affiche de films • Symboles sur les sommets : chiffres • Utiliser l’espace : rapprocher des films ayant le même casting • Rendu (travaux en cours) • Choix de l’application, choix de l’interaction, .. • Stratégie d’accès aux données (travaux en cours) • Overview, zoom & details [Shn96] • Focus+Context • Approches multi-résolutions [Shn96] Ben Shneiderman. The eyes have it : A task by data type taxonomy for information visualizations. Proceedings of the 1996 IEEE Symposium on Visual Languages, page 336, Washington, DC, USA, 1996. IEEE Computer Society. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  20. Exemple de coordination • Assister la tâche de l’utilisateur avec une visualisation personnalisée des données. • Coordonner les vues • Couleur, formes, distances, .. • A partir de plusieurs points de vue, représentations • Approches multi-résolution • Pour gagner du temps • Agrégation sémantique • Agrégation visuelle ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  21. Bilan de la personnalisation • Deux approches de personnalisation émergent : • Côté représentation et interaction (voir modèle) : • Choix de métaphore visuelle, d’environnement, de résolution, .. • Côté données : • Ajout de données « invisibles » ou « implicites » dans la représentation : • Historique, traces, autres utilisateurs, .. • Ces données pourront être personnalisées dans leur représentation. • Choix d’une approche? Approches mixtes? • Travaux en cours ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  22. Conférence InfoVis • Conférence IEEE (créée en 1995) sur la visualisation d’information • http://www.infovis.org/ • InfoVis Contest (associé à InfoVis depuis 2003) • 2004 : bibliography • 2006 : U.S. Census Data • 2007 : … ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  23. InfoVis’07 Contest The (2007) data set consists of about Hollywood movies including actors, actresses, awards, and similar. This year's focus is on the design aspects of the visualization in addition to its exploratory and analytical aspects, and entrants are encourages to augment the data set with any publicly available data. • http://conferences.computer.org/infovis/infovis2007/contest.html • C’est une question très ouverte • Possibilité d’utiliser MovieLens, préférences des utilisateurs, .. ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  24. Des idées? • IMDB dataset déjà très utilisé (structure en graphe, requêtes bases de données, small world) • Autres Pistes? • Visualiser le jeu de données de manière personalisée? Quels critères? • Visualiser la personnalisation du jeu de données? • Visualisation la propagation d’une requête? • Visualiser les préférences/évaluations? • Autres idées? (deadline le 13 juillet 2007) ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

  25. Fin • Des questions? ACI MASSES DE DONNEES - PROJET MD33/04-07 - APMD: ACCES PERSONNALISE A DES MASSES DE DONNEES INSA de Lyon

More Related