300 likes | 474 Views
Projet « R et Internet ». Agrocampus Ouest, 10 octobre 2013. Lucien DJIVOH, Alexandre MULLER, Solène MORVANT, Jean-Baptiste RIOU, Pierre TREMBLAY. Introduction. R, un logiciel utilisé partout dans le monde. Idée développée par Karim Chine : créer une interface R sur internet.
E N D
Projet « R et Internet » Agrocampus Ouest, 10 octobre 2013 Lucien DJIVOH, Alexandre MULLER, Solène MORVANT, Jean-Baptiste RIOU, Pierre TREMBLAY
Introduction • R, un logiciel utilisé partout dans le monde. • Idée développée par Karim Chine : créer une interface R sur internet. • Possibilité de stocker des données et d’interagir sur un domaine virtuel.
Plan Introduction I – Qu’est-ce que le cloud ? II - Principe de ELASTIC-R III – Comment manipuler ELASTIC-R ? IV – Avantages et inconvénients Conclusion
I – Qu’est-ce que le cloud ? • L’informatique dans les nuages • Le cloudcomputing est une technologie permettant d’accéder à des ressources informatiques localisées sur des serveurs. • Les données ne sont plus stockées sur votre ordinateur mais quelque part sur internet. N’importe où?... Pas vraiment… Les données d’un cloud sont stockées dans des data centers Data center de Microsoft au Texas Data center d’Amazon dans l’Oregon
Extérieur d’un des nombreux data center de Google Intérieur d’un data center de Google
« L'informatique dans les nuages est un modèle permettant d'établir un accès par le réseau à un réservoir partagé de ressources informatiques standard configurables (réseau, serveurs, stockage, applications et services) qui peuvent être rapidement mobilisées et mises à disposition en minimisant les efforts de gestion ou les contacts avec le fournisseur de service . » Définition du National Institute of Standards and Technology
Les différents types de cloud • Cloud public • Structure élastique et ouverte • Facile et rapide à mettre en place • Il faut passer par un fournisseur tiers • Problème de sécurité des données • Cloud privé • Sécurité accrue pour les données sensibles • Dédié à une entreprise & géré par celle-ci • Consolidation nécessaire des ressources informatiques • Problèmes en cas de hausse du traffic • Cloud hybride • Intègre les avantages des deux • Surcroît de gestion
Le cloud en chiffres Le cloud est une technologie très largement utilisée et a un très bel avenir devant elle !! • On estime à 1,96 milliard € le marché du cloud français ! Soit: Une augmentation de 46 % par rapport à 2011 Une prévision d’augmentation de 35% pour 2013 • Le cloud public représente 65,5 % du marché total français. • Au niveau mondial, 111 milliards $ sont investis dans le cloud Somme qui devrait atteindre 131 milliards cette année • Actuellement, 35 % des entreprises utilisent les services d’un cloud • Elles devraient être 80 % à l’utiliser d’ici l’année prochaine (Chiffres des cabinets d'études IDC et Gartner)
L’utilité des clouds: entre entreprises et particuliers • IaaS (Infrastructure as a Service) • Mise à disposition de serveurs • Emplacements vierges (OS et applications à la charge du consommateur) • PaaS (Platform as a Service) • Mise à disposition de plateforme web • OS et outils d’infrastructure fournis par le fournisseur • Le consommateur a le contrôle des applications et peut en rajouter • SaaS (Software as a Service) • Dématérialisation des logiciels • La maintenance des logiciels est à la charge du fournisseur • Services google, par exemple • D’autres services : STorage as a Service , Data as a Service, Desktop as a Service, etc.
Plan Introduction I – Qu’est-ce que le cloud ? II - Principe de ELASTIC-R III – Comment manipuler ELASTIC-R ? IV – Avantages et inconvénients Conclusion
II - Principe de ELASTIC-R Elastic-R : plateforme collaborative de recherche informatique et traitement statistique (analogie : Google doc) Permet l’intégration et la visualisation de l’accès à des moteurs et serveurs R. Conçu et mis en œuvre par Karim Chine Elastic-R est une plate-forme open-source universelle hautement innovante pour les calculs statistiques et mathématiques dans le Cloud. Combine les capacités de R et les flexibilités d'un système basé sur Java pour créer un outil puissant et d'utilité considérable.
II - Principe de ELASTIC-R Elastic-R établit un environnement de travail et fournit un cadre permettant la connexion de tous les éléments d’un environnement informatique : • La ressource informatique • Les composants informatiques • Les Guis
II - Principe de ELASTIC-R Travailler en collaboration sur des sessions R Plusieurs utilisateurs peuvent se connecter et analyser ensemble des données via des écrans de diffusion Journal de contrôle envoyé en temps réel aux utilisateurs Un chat et un graphique périphérique sont mis à jour de façon synchronisée pour tous
II - Principe de ELASTIC-R Plate-forme ouverte de calcul
II - Principe de ELASTIC-R Session de travail virtuelle et collaborative
Plan Introduction I – Qu’est-ce que le cloud ? II - Principe de ELASTIC-R III – Comment manipuler ELASTIC-R ? IV – Avantages et inconvénients Conclusion
III – Comment manipuler ELASTIC-R ? Création d’un compte gratuit : on accède à une interface gratuite
III – Comment manipuler ELASTIC-R ? 2) On a accès à un console utilisable comme R. On installe le package FactoMineR et on va développer un exemple avec le jeu de données wine.
III – Comment manipuler ELASTIC-R ? • Sortie graphiques accessibles aisément
III – Comment manipuler ELASTIC-R ? Une interface de recherche des objets que l’on a créés ou importés Ensemble des objets dont le nom contient « pca » Ensemble des packages chargés 20
III – Comment manipuler ELASTIC-R ? • Sortie graphiques accessibles aisément
III – Comment manipuler ELASTIC-R ? Cercle de corrélation pour les variables d’une ACP
III – Comment manipuler ELASTIC-R ? Interface graphique aux outils graphiques de base
III – Comment manipuler ELASTIC-R ? Possibilité de créer des bases de données, mais fonctions plus que limitées…
III – Comment manipuler ELASTIC-R ? Mais comment sauvegarde-t -on?
Plan Introduction I – Qu’est-ce que le cloud ? II - Principe de ELASTIC-R III – Comment manipuler ELASTIC-R ? IV – Avantages et inconvénients Conclusion
IV – Avantages et inconvénients Avantages : • Archivage instantané • Partage de l’information en temps réel et gratuit • Outil collaboratif adapté à la recherche • Plateforme adaptée à différents langages (Python, Java...) • Plateforme d’apprentissage fiable et abordable pour l'éducation statistique
IV – Avantages et inconvénients Inconvénients : • Interface pas très intuitive • N’existe qu’en anglais • Le compte AWS ne permet pas de rester connecté plus de 4h d’affilée (système de tokens) • Importation des données uniquement par lien URL • Sécurité des infos ?
Conclusion • Sur un plan technique, aucune différence avec R • Le challenge : comprendre l’interface Elastic-R • L’aspect « user-friendly » peut encore être développé • D’autres logiciels accessibles tels Scilab, Python,…
Bibliographie • CHINE, Karim. « R and the Cloud » . Deuxièmes rencontres R. 27 juin 2013. • CHINE, Karim. « Learning math and statistics on the cloud » icalt, pp.752-753, 2010 10th IEEE International Conference on Advanced Learning Technologies, 2010. • elastic-r.net [en ligne] http://elastic-r.net/ • Journal du net [en ligne] consulté le 9 octobre 2013. disponible sur: http://www.journaldunet.com/solutions/cloud-computing/marche-du-cloud.shtml