1 / 1

Le Traitement Informatique des Données Scientifiques

Le Traitement Informatique des Données Scientifiques. Oleg LODYGENSKY lodygens@lal.in2p3.fr Etienne URBAH urbah@lal.in2p3.fr LAL, Univ Paris-Sud, IN2P3/CNRS, Orsay, France. 1) Le traitement informatique des données scientifiques exige bien plus que le simple

jared
Download Presentation

Le Traitement Informatique des Données Scientifiques

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Le Traitement Informatique des Données Scientifiques Oleg LODYGENSKY lodygens@lal.in2p3.fr Etienne URBAH urbah@lal.in2p3.frLAL, Univ Paris-Sud, IN2P3/CNRS, Orsay, France 1)Le traitement informatique des données scientifiques exige bien plus que le simple calcul numérique :  Acquisition des données  Gestion d’instrument  Gestion des données et méta-données  Ordonnancement des tâches  Calcul numérique  Filtrage, Tri, …  Affichage graphique 5) Avec une machine personnelle (PC, Téléphone portable) : Les droits d’accès sont simples, Mais l’espace de stockage et la puissance de calcul sont limités. 2) Lorsque l’ordonnancement des tâches est séquentiel, il faut un ordinateur possédant un processeur rapide : 6) En général, les instituts et centres de recherche gèrent un domaine administratif informatique protégé par un pare-feu. Ce domaine administratif permet à chaque utilisateur autorisé d’accéder à toutes les ressources partagées, suivant ses droits. P a r e – f e u Données d’entrée Étape 1 Étape 2 Étape 3 Données de sortie Étape n-2 Étape n-1 Étape n 3) Lorsque l’ordonnancement des tâches est parallèle non couplé, il suffit d’utiliser beaucoup de processeurs indépendants : 7) Une telle ressource partagée est, suivant les moyens : Un simple ordinateur, sur lequel l’utilisateur s’authentifie à distance. Un cluster (grappe d’ordinateurs communiquant bien), sur lequel l’utilisateur s’authentifie à distance. Une grille locale (ensemble d’ordinateurs indépendants), à laquelle l’utilisateur soumet des données et des tâches. Un nuage local (ensemble d’ordinateurs virtualisés), auquel l’utilisateur soumet des images de machine virtuelle. Un supercalculateur auquel l’utilisateur soumet des calculs fortement couplées sur des données de grande taille. Données d’entrée 1 Données d’entrée 2 Données d’entrée 3 Données d’entrée n … Données de sortie 1 Données de sortie 2 Données de sortie 3 Données de sortie n 8) Les instituts et centres de recherche de la terre entière ont besoin d’échanger des données en toute sécurité. Pour cela, ils se fédèrent en une infrastructure distribuée basée sur la confiance mutuelle, en utilisant des procédures communes. Cela permet aussi de mutualiser la puissance de calcul de tous. 4) Lorsque l’ordonnancement des tâches est parallèle fortement couplé, il faut utiliser un supercalculateur, qui intègre beaucoup de processeurs puissants communiquant très bien : Données d’entrée Données de sortie Cette infrastructure distribuée de traitement des données est souvent appelée ‘Grille de calcul’, ou même simplement ‘Grille’. Pour que chaque utilisateur soit bien identifié par la Grille, son institut de recherche doit lui fournir un ‘Certificat de Grille’. Tout citoyen peut contribuer au traitement des données scientifiques, en installant sur son ordinateur un logiciel comme Boinchttp://boinc.berkeley.edu/ ou XtremWebhttp://www.xtremweb-hep.org/

More Related