670 likes | 859 Views
Arquitectura s paralel a s. 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500). P. SMP. fl. instrucciones. C. 1. N. bus. memoria compartida. SISD. 1. MP. flujo datos. P. N. SIMD. MIMD.
E N D
Arquitecturas paralelas 9.Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500).
P SMP fl. instrucciones C 1 N bus memoria compartida SISD 1 MP flujo datos P N SIMD MIMD MPP/NUMA Clusters C M Array Vectorial red general memoria distribuida Arquitectura de los sistemas paralelos
Evolución de las arquitecturas Un procesador (vectorial) Sistemas SMP / sistemas SIMD Sistemas masivamente paralelosMPP Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc. Perocoste muy elevado. Clusters
Top500 (www.top500.org) Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK. Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual). Se mide el valor de Rmax,NmaxyN1/2. También se empieza a medir la potenciaconsumida.
Top500 Cada 6 meses desde 1993 (junio/noviembre) Lista nº 40 - noviembre 2012 Más o menos aceptado por todos los fabricantes. Análisis de tendencias / evolución del mercado.
Top500 Evolución de la velocidad de cálculo Top5+ Fabricantes Procesador: arquitectura / familia / número Sistema: arquitectura / red / S.O. Utilización
×1,9/año Top500 162,1 PF/s 14.885.800 cores (29.771 c. - 10,9 GF/s) Titan K-computer Sequoia Tianhe-1A RoadRunner Jaguar BlueGene NEC Earth Sim. IBM ASCI White LLNL Intel ASCI Red SandiA 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015
Top5 (diciembre 12) Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna
Top500 fabricante del sistema
Top500 arquitectura del procesador 217: Earth Simulator 2, NEC – 0,12 PF/s – 1.280 cores
Top500 familia de procesadores
Top500 Num. cores (mpp / cluster)
Top500 Sequoia ASCI Red Titan Earth Sim. CM5 T3E T3D Blue Gene Paragon RoadRunner CM2 SP2 Jaguar Sun HPC Tianhe-1A Y-MP C90 K computer VP500
Top500 arquitectura del sistema un año → x 2,20 x 1,6
Top500 Red de conexión
Top500 área de utilización
Top500: España/Francia (dic. - 12) • Mare NostrumIBM iDataPlex, Xeon E5 (8c), Infiniband FDR • 33.664 cores – 637 TF/s • 290 BSC Bull, cluster (Infin.) – 5.544 cores – 103 TF/s • >> 39.208 cores – 0,7 PF/s (0,3%) 11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 c. – 1.359 TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, 138.368 c. – 1.050 TF/s 31/32 BlueGene/Q Power BQC, 65.536 c. - 690 TF/s … Total: 21 sistemas (EDF, Airbus, CINES, Total,…) >> 620.248 c.- 6,5 PF/s (4%) • >> Europa: Alemania (19 - 10,2 PF/s), G.B. (24 – 7,3 PF/s),Italia(7 - 2,4 PF/s) • Total: 31,2 PF/s (20%)
El cluster ARINA de la UPV/EHU Arina, Arinaz (260 núcleos, Itanium2) Guinness (440 núcleos, Xeon) Maiz (40 núcleos, Opteron) Sistema paralelo de ficheros (SFS) 4 servidores 4,7 TB / 7,1 TB Infiniband, 1 GB/s
CFX, dinámica de fluidos MOLCAS, estructura molecular ADF, estr. electrónica de las moleculas WIEN2K, estr. electrónica de sólidos Qsite, proteínas NBO5-NBOView, enlaces moleculares El cluster ARINA de la UPV/EHU Aplicaciones En general, de química, física y biología. Software adquirido:
Laboratorio de Paralelismo Cluster del laboratorio 32 + 3×4 procesadores (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC
RoadRunner Cell
BlueGene/L 15 way fully assoc. pref. caches 11 GB/s 27 GB/s 5,5 GB/s 22 GB/s 5,5 GB/s
BlueGene/L 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s bisección tr (max) = 69 ns cut-through adaptativo deadlock-free active messages