430 likes | 663 Views
Grids. Cluster. High-availability (HA) Clusters (Linux HA) Load-balancing Clusters (Platform LSF HPC, Sun Grid Engine, Moab Cluster Suite and Maui Cluster Scheduler) High-performance (HPC) Clusters (Beowolf) Grid Clusters: Computational Grids Data Grids Equipment Grids. GLOBUS.
E N D
Cluster • High-availability (HA) Clusters (Linux HA) • Load-balancing Clusters (Platform LSF HPC, Sun Grid Engine, Moab Cluster Suite and Maui Cluster Scheduler) • High-performance (HPC) Clusters (Beowolf) • Grid Clusters: • Computational Grids • Data Grids • Equipment Grids
Applications…….. Users…… ……...Organizations Information Serveces Resource Management Data Management Grid Security Infrastructure
process GridFTP MDS GRAM Resources FTP server GRIS jobmanager LDAP LDAP RSLHTTP1.1 Gsiftp/http/https/file gatekeeper resource finding data transfer data control Job allocation Job management USE USE USE proxy GIIS Initialize/destroy user Client
GRAM Sever GRAM Client HTTP/1.1 RSL globusrun globusrun Gatekeeper GSI Client GSI Client GSI Sever RSL callback fork Job Manager Job satus/cancel RSL Parser RSL file use (opcioptional) Perl Script stdout File transfer GASS GASS Output transfer qsub bsub fork Process PBS Job LSF Job Local Resource Manager
GRAM Client HTTP/1.1 RSL globusrun RSL DUROC DUROC Parser GRAM Server 1 GRAM Server 2
Host C Host A GIIS Request and response of resource information MDS Client Host B Request and response of resource information GIIS Register Register GRIS Request and response of resource information Local resource information Information Provider Local resource information Resources Idapsearch Idapadd/delete/modfy slapd LDAP base
GridFTP Client GridFTP Server Globus-url-copy In.ftpd control File File transfer
Visión • Construir una nueva infraestructura para soportar aplicaciones científicas basadas en grids (hw,sw,networks,new practices, new policies) • Expandir los centros de cómputo para soportar al infraestructura tecnológica • Centros de operación coordinados y distribuidos geográficamente. • Explotar conocimiento y experiencia, de modo que el todo sea más que la suma de sus partes. • Homogenizar para realizar el trabajo distribuido de forma sencilla y de manera estándar. • Ejecutar un trabajo en toda la TeraGrid • Migrar ejecutables entre sitios.
Objetivos • Crear una capacidad de cómputo sin precedentes • Crear un sistema balanceado y distribuido. • No un computador distribuido sino un sistema distribuido • Definir una infraestructura abierta y extensible • Permitir la incorporación de nuevos recursos tanto en los centros de investigación participantes como en nuevos centros que se incorporen al sistema. • Retos • High-speed networks • Grid Services • Grid-Enlabled TeraScale facilities • WAN
Escenarios de uso y Componentes • Hardware: Linux/Intel Clusters, Alpha SMP cluster … • Large-scale storage systems • High-Speed backbone • Grid middelware • Next Generation applications • Visualización remota de grandes cantidades de datos y aplicaciones sincronizadas armónicamente • Número variable de procesadores y adaptación a tiempos de latencia variable. • Alto Throughput
Tipos de Aplicaciones • Computación intensiva • Data intensiva • Acopladas a instrumentos científicos • Procesamiento y análisis de datos “cercanos” y en tiempo real • Entes participantes (inicialmente) • Argonne National Laboratory • Caltech • The National Center for Supercomputing Applications • San Diego Supercomputer Center • Texas Advanced Computing Center
Recursos y Servicios • Compute Resources • Data Resources and Data Management Services • Visualization Resources • Network Resources • Grid Services • Grid Scheduling • Allocations and Proposals
SuSE SLES X-cat OpenPBS Maui scheduler MPICH, MPICH-G2, MPICH-VMI gm drivers VMI/CRM Globus Condor-G gsi-ssh GPT Wizard and GPT GPT SoftEnv MyProxy Intel compilers GNU compilers HDF4/5 SRB client Software Stack
Middleware: Se refiere a una pieza de software que conecta dos o más aplicaciones para que puedan intercambiar datos. • Middleware de Grids: Integra y organiza recursos computacionales en un grid para presentarlos de manera homogénea.
Proyecto Enabling Grids for E-siencE • Construir un grid robusto y seguro que atraiga muchos recursos de computo • Continuamente mejorar y mantener un middleware para este grid. • Atraer nuevos usuarios de industrias y áreas científicas.
Requerimientos del GRID de EGEE • Heterogeneidad • Agrupación de recursos vía VO. • Utilización de recursos existentes • Ejecución de trabajos • Servicios de datos • Seguridad • Escalabilidad • Disponibilidad
LCG-2 (=EGEE-0) 2004 prototyping prototyping product 2005 product LCG-3 EGEE-1 • gLite fue creado por el proyecto EGE en abril de 2005 • Se unificó con LCG en mayo de 2006
gLite (Lightweight Middleware for Grid Computing): Es un middleware para grids orientado a servicios. Brinda servicios para permitir la administración de computo y almacenamiento distribuido. • Características: • Orientado a servicios • Rehúso de componentes ya realizados • Portable • Seguro • Tolerante a fallos • Compatibilidad con infraestructura ya existente • Software libre
Componentes Cada componente de gLite está compuesto a su vez por una serie de paquetes de software (RPMs). Por esto los componentes son denominados metapaquetes. Estos paquetes de software deben ser configurados adecuadamente para trabajar “juntos”. • User Interface (UI) 2. WorkloadManagement System (WMS) / Resource Broker (RB) 3. Computing Element (CE) 4. Worker Node (WN) 5. The Logging and Bookkeeping service (LB)
Servicios • Information & Monitoring Service • Job Management Service • Data Management Service • Security Service
Information & Monitoring Service • R-GMA (Relational Grid Monitoring Architecture) • Servicio genérico de descubrimiento. • Instrumentos de apoyo para las transacciones - Replicación de registros -API mas simple -Enfrentarse a la vida en el grid (redes configuradas pobremente, MySQL corrupto, etc.)
Job Management Service • Computing Element - CE mueve las VO basado en el planificador local • - Políticas basadas en los cambios de los CE • Logging and Bookkeeping - Sigue trabajos durante su curso de la vida (en términos de acontecimientos) • Migraciones Compatibibles
Data Management Service • Elementos de almacenamiento • Replicación de catálogos y archivos • Transferencia y ubicación de archivos • Catalogo de meta-datos.
Security Service • VOMS • Job Management Services WMS, LB y CE se utilizan bajo la autorización basada en VOMS, y en la información de los usuarios • Data Services Autorizaciones a través de las ACL • Information Services Autentificación basadas en los certificados de los VOMS
SUMA/G USB
SUMA como conjunto de servicios CORBAProceso de ejecución e invocación • Execute • Submit • Agentes de Ejecucion (Execution Agents) • Cliente Interno (Client Stub) • Representante (Proxy) • Planificador (Scheduler) • Control de Usuario (UserControl)
Tolerancia a Fallas • CheckPoints
SUMA - Otras Características: • Planificador • Seguridad • Administración
PREGUNTAS… GRACIAS!