1 / 35

Infraestructuras de Accounting en EGEE

Infraestructuras de Accounting en EGEE. sumario presentación. Descripción general del CESGA Cálculo INTENSIVO Almacenamiento Accounting en el Cesga Accounting en EGEE. misión.

Download Presentation

Infraestructuras de Accounting en EGEE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Infraestructuras de Accounting en EGEE

  2. sumario presentación • Descripción general del CESGA • CálculoINTENSIVO • Almacenamiento • Accounting en el Cesga • Accounting en EGEE

  3. misión • Promover servicios comunes de apoyo a la investigación, desarrollo en innovación en el ámbito de las tecnologías de la información y de las comunicaciones, en Galicia y en la comunidad investigadora del CSIC. • Promover acciones tendentes a la innovación y a la mejora en la prestación de servicios de cálculo intensivo y comunicaciones avanzadas, asi como actividades encaminadas a promover soluciones innovadoras en el mundo de la Sociedad del Conocimiento

  4. personalidad jurídica • Fundación Pública • Empresa Pública socios y patronatos • Xunta de Galicia 70% • CSIC 30%

  5. usuarios • Universidades gallegas • Centros de investigación de la Xunta de Galicia • Centros y laboratorios del CSIC • Departamentos de I+D de empresas • Centros de investigación europeos • Otras instituciones (centros tecnológicos, hospitales, fundaciones,...)

  6. 2001 2002 2003 SVG HPC 320 SUPERDOME BEOWULF 9,9 GFLOPS 64 GFLOPS 16 GFLOPS 768 GFLOPS 11 años de historia: el cálculo intensivo 1998 1993 1999 VP 2400 HPC 4500 AP 3000 VPP 300 STORAGETEK 51 TERABYTES 12 GFLOPS 2,5 GFLOPS 14,1 GFLOPS 9,6 GFLOPS 2004 SVG 512 GFLOPS

  7. Cluster DELL NUEVO SERVIDOR DE CÁLCULO Throughput 2004 80 procesadores P4@3.2GHz, 1MB cache, 1 GB memoria, 160GB disco Interconexión Gigabit, Total 512GFlops pico, 80GB memoria, 12TB disco

  8. infraestructura: almacenamiento

  9. evolución de la capacidad de cálculo instalada en el cesga

  10. evolución del consumo de horas de cpu en cesga

  11. utilización de los recursos de cálculo

  12. Necesidad de acounting Qué se usa (Sistemas, nodos, software, etc...) Cómo se usa Quién lo usa Cuál es el comportamiento? Tiempos de espera en cola, niveles de disponibilidad, calidad esperada!, etc... Cerrar el lazo con los SLA. Ejemplos: si un usuario/institución está saturando las colas, penalizar (menos prioridad). Determinación de la eficiencia de las políticas de distribución de trabajos, etc... Hacer un coste realista del consumo (no es suficiente el número de horas consumidas, sino el número de horas en qué arquitectura, y no sólo el procesador, sino tener en cuenta también la memoria, sistema de E/S, etc...)

  13. Arquitectura de acounting en el cesga • Información proveniente de: • Base de datos de usuarios (login, departamento, proyecto, etc...) • Ficheros logs de sistemas de colas (actualmente LSF, PBS, SGE) • Consumo de los sistemas (ficheros acct) • Monitorizacion del los sistemas (ficheros sa) • Generamos base de datos (MySQL) de consumos/trabajos • Scripts de consulta en PHP • Consultas web

  14. Distribución por instituciones

  15. Tiempo medio de espera en cola

  16. Porcentaje de ocupación Servidor de cálculo HPC320, año 2003

  17. Número de procesadores solicitados (jan-aug - 2004)

  18. Memoria solicitada (jan-aug - 2004)

  19. Tiempo solicitado (jan-aug - 2004)

  20. Espacio en disco solicitado (jan-aug - 2004)

  21. Arquitectura de accounting Accounting Resource metering: getting info about resource usage Storage Element Computing Element

  22. Arquitectura de accounting Accounting Reports about resource usage per user / VO/ resource Storage Element Computing Element

  23. Arquitectura de accounting Resource pricing Accounting Storage Element Computing Element Resource owner

  24. Arquitectura de accounting Resource pricing Cost computation Accounting Storage Element Computing Element Resource owner

  25. Quién Desarrollado para el GOC en el RAL John Gordon y Dave Kant CCLRC e-Science Centre, UK EGEE JRA1 IT-CZ cluster homepage http://egee-jra1-wm.mi.infn.it/egee-jra1-wm EGEE JRA1 (middleware activity) homepage http://egee-jra1.web.cern.ch/egee-jra1

  26. Arquitectura de accounting Dos partes diferenciadas: La infraestructura de recogida y tratamiento de la información de accounting basada en R-GMA y que concentra todos los datos en un punto central Un portal web para permitir la visualización de distintos tipos de informes en funcion de las demandas Basado en R-GMA, cada site debe instalar un nodo local R-GMA MON para almacenar la información de accounting Soporta PBS (lcgpbs, pbspro, Vanilla pbs, openpbs, torque) y BQS. Trabajando en soportar LSF. CESGA tratará de integrar SGE Se deben almacenar los logs de batch, gatekeeper y mensajes del sistema Se asume que el ID del grupo utilizado para ejecutar los trabajos del usuario es el nombre de la VO (pendiente de confirmar) Asume que el cluster es homogéneo. Páginas web de accounting en el GOC están siendo desarrolladas: http://goc.grid-support.ac.uk/gridsite/accounting/index.html Estará incluído en el próximo SLC3

  27. Arquitectura de accounting La información se obtiene de 3 logs: Gatekeeper Records contain DN, GramScriptJobID and the manager type (lcgpbs, fork, lcglsf). Gatekeeper logs are used to distinguish jobs that are submitted through the grid (grid jobs) from jobs submitted locally (non-grid jobs) on the fabric. Messages logs contain mappings between GramScriptJobID and LocalJobID of Batch System. Batch Logs do not distinguish between grid jobs and non-grid jobs. Batch Logs: “E” (PBS) or “JOB_FIINISH” (LSF) and LocalJobID, LocalUser, LocalGroup, StartTime, StopTime, ExecutingHost, CPUTime, MemoryUsage, Exit Status, …

  28. GOC Site filter filter filter filter RAW AccountingData MON Accounting Service On Demand Data Aggregation per VO per ROC Reports Arquitectura de accounting LCG SITE LCG SITE Site GIIS CE MON RGMA Batch Log Data Sources GK Log messages

  29. Cada Site, por VO, por Mes Arquitectura de accounting Interface para elegir la visualización de los datos: VO, ventana temporal y Region BaseCpuSeconds agregados en EGEE Cada Region, por VO, por Mes Otras Distribuciones CPU Normalizada Nº de trabajos http://goc.grid-support.ac.uk/gridsite/accounting/index.html

  30. Actividad prevista en el Cesga en accounting Dar soporte a la federación Portar a otros sistemas de colas Clusters heterogéneos Otras plataformas Accounting de sistema Accounting de almacenamiento Integración con políticas SLA Colaborar en el desarrollo

  31. Gracias!! Carlos Fernández, carlosf@cesga.es

More Related