1 / 31

iPlots

iPlots. Brit Anne-Cécile Dufeil Elodie Emzivat Audrey. Introduction. Les représentations de données sur R : La fonction plot: fonction générique de R qui permet de représenter tous les types de données. Exemple : plot(maxO3~T15, data=ozone). Introduction.

creola
Download Presentation

iPlots

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. iPlots Brit Anne-Cécile Dufeil Elodie Emzivat Audrey

  2. Introduction • Les représentations de données sur R : • La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : plot(maxO3~T15, data=ozone)

  3. Introduction • Les représentations de données sur R : • La fonction plot: fonction générique de R qui permet de représenter tous les types de données Exemple : boxplot(maxO3~vent, data=ozone)

  4. Introduction • Les représentations de données sur R : • La fonction plot: fonction générique de R qui permet de représenter tous les types de données. • Avec cette fonction, on peut : • Modifier la taille et la forme des points • Ajouter des lignes au graphique, des symboles, des légendes … • Il existe d’autres packages avec des fonctions pour représenter les données : • iplots : permet de créer des graphiques interactifs.

  5. Sommaire • Présentation du package iplots • Les graphiques et les différentes options • Application sur un jeu de données • Conclusion

  6. I. Présentation générale du package • Création Quand ? En 2003, au 3e congrès international ‘DistributedStatisticalComputing’ (DSC 2003) puis en 2006 à la conférence useR!2006, pour la version 2.0 Où ? RoSuDa, Université d’Augsburg en Allemagne (Dept. Of Computer OrientedStatistics and Data Analysis) Qui ? Simon Urbanek Martin Theus Tobias Wichtrey Alex Gouberman

  7. I. Présentation générale du package • Fonctionnement général • iplots fournit des graphes interactifs liés entre eux • Tous les graphes issus d’une même jeu de données sont automatiquement liés • Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes

  8. I. Présentation générale du package • Fonctionnement général • iplots fournit des graphes interactifs liés entre eux • Tous les graphes issus d’une même jeu de données sont automatiquement liés • Un groupe identifié par une couleur dans un graphe est mis en évidence par la même couleur dans tous les autres graphes

  9. II - Les Graphiques et les différentes options

  10. Représentation d’une variable quantitative Histogramme : > ihist(association) De nombreuses actions sont possibles en utilisant le clique-bouton, pour une utilisation simplifiée

  11. Représentation d’une variable quantitative Estimateur à noyau : > iplot(density(sand[,"association"]))

  12. Représentation d’une variable qualitative Diagramme en barres (compte les effectifs pour chaque modalité) >ibar(Sexe)

  13. Représentation de deux variables qualitatives Représentation d’un nuage de points : >iplot(appetance,attrait)

  14. Variable quantitative en fonction d’une variable qualitative Graphique avec une boîte à moustache par modalité de la variable qualitative >ibox(Sepal.length,species)

  15. Graphique qui permet de voir toutes les associations des modalités de plusieurs variables qualitatives. >ipcp(Produit,association) #Interactive parallelcoordinates plot Représentation de variables quantitatives et qualitatives

  16. Représentation de deux variables

  17. Représentation de plusieurs variables qualitatives • On observe l’association de 2 variables qualitatives, à chaque intersection, on trouve • les individus qui possèdent les 2 modalités. • Imosaic(Produit,achat) • Observation des données Donnéesattendues

  18. Représentation de plusieurs variables En sélectionnant Multiple barcharts on peut obtenir un graphique avec à la fois les résultats attendus et observés >Multiple barcharts

  19. Gestion courante des graphiques • Comment modifier les graphiques ? • iplot.opt() • iplot.opt(..., plot=iplot.cur()) • Arguments : … paramètres à modifier, plot : graphique qui va subir les modifications • Que peut-on modifier ? • title: titre du graphique (attention le titre n’apparaît pas sur le graphique) • xlim, ylim: limites des axes • col: couleur • ptDiam: diamètre des points • anchor ou binw: modification de la longueur et la largeur d’un histogramme • Trier les variables qualitatives en fonction de leur effectif (histogramme) • Voir l’aide de la fonction iplot.opt() • Remarque : la plupart des modifications peuvent être effectuées à partir de l’onglet « View »

  20. Gestion courante des graphiques Exemples : Modifier la taille des points >iplot(appetance,attrait) >iplot.opt(ptDiam=10) Changer la forme de l'histogramme >ihist(association) >iplot.opt(anchor=1, binw=1,title= "histogramme association sandwich")

  21. Gestion courante des graphiques : ajouter de la couleur • Plusieurs façons de procéder : • Sélectionner l’onglet« View », puis « Set Colors  CB» ou « Rainbow» • Appliquer une couleur par produit de manière permanente • >ibar(Produit) • >iset.col(Produit) #iset.brush(Produit) • >iplot.opt(title="essai fonction ") • Autre façon d’attribuer une couleur à chaque produit • >ibar(Produit) • >iplot.opt(col=unclass(Produit),title="Analyse sensorielle sandwich")

  22. Gestion courante des graphiques : ajouter de la couleur • Interaction entre les graphiques • Appel des graphiques à l’aide de l’onglet « Windows »

  23. Gestion courante des graphiques : selectionner • Plusieurs façons de procéder : • Peut aussi se faire à l’aide de la souris en sélectionnant simplement ce qui nous intéresse • Sélectionner les notes supérieures à 5 (attention, ne pas oublier d’enlever les couleurs ) >iset.select(association >= 5) • Elements concernant la sélection • Quel est le pourcentage d'éléments sélectionnés? >sum(sign(iset.selected()))/length(association) 0,8819 : il y a 88% des notes concernant la variable association qui sont > à 5 • Tous les graphiques associés à cette sélection vont l’afficher

  24. Ajout d’information sur un graphique : iObjects iablinecolorier les lignes Créer le scatterplot et y ajouter une droite > iplot(association, attrait) Droite de régression > z <- lm(association ~ attrait, data = sand) > iabline(z,col="blue") ilines Créer le scatterplot et y ajouter une droite > iplot(association,attrait) Utiliser la fonction lowess > m<- lowess(attrait, association) > ilines(m,col=blue)

  25. Autres fonctions :

  26. III -Application sur un jeu de données

  27. Application : sandwish Charger les packages : rJava puis Iplots Attach (sand) : The database is attached to the R search path. This means that the database is searched by R when evaluating a variable, so objects in the database can be accessed by simply giving their names. Importation du jeu de donnée >sand=read.table("sand.txt",header=T, dec=".", sep="\t") >summary(sand) Recoder les variables >sand[,"Produit"]=as.factor(sand[,"Produit"]) >sand[,"Juge"]=as.factor(sand[,"Juge"]) >sand[,"Seance"]=as.factor(sand[,"Seance"]) >sand[,"Ordre"]=as.factor(sand[,"Ordre"]) >summary(sand) >names(sand) Préciser que les variables sont dans la base de donnée R, ensuite il suffit de les appeler en donnant leurs noms >attach(sand)

  28. Conclusion

  29. Conclusion • L’intérêt de ce package: • Outil intéressant pour l’aide à la compréhension des jeux de données • Complément aux graphes classiques, support visuel intéressant • Facilité d’utilisation • Variables qualitatives faciles à visualiser • Mais … • Visualisation des variables quantitatives moins évidente • Certaines fonctions ne fonctionnent pas • Attention aux données manquantes • Exportation des graphiques compliquée

  30. Bibliographie • Article dans r-bloggers consacré au package avec quelques exemples : http://www.r-bloggers.com/interactive-graphics-with-the-iplots-package-from-%E2%80%9Cr-in-action%E2%80%9D/ • Site consacré au package iplots, comprenant des exemples et les derniers ajouts : http://www.rosuda.org/iplots/ • Proceedings of the 3rd International Workshop on DistributedStatisticalComputing http://www.ci.tuwien.ac.at/Conferences/DSC-2003/Proceedings/UrbanekTheus.pdf • Présentation du package iplots 2.0 par ses créateurs: http://www.rosuda.org/iplots/pdfs/iPlots.pdf

More Related