1 / 67

Arquitectura s paralel a s

Arquitectura s paralel a s. 9. Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500). P. SMP. fl. instrucciones. C. 1. N. bus. memoria compartida. SISD. 1. MP. flujo datos. P. N. SIMD. MIMD.

gilles
Download Presentation

Arquitectura s paralel a s

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Arquitecturas paralelas 9.Herramientas para la programación de aplicaciones paralelas: OpenMP y MPI (introducción). Computadores de alta velocidad (la lista top500).

  2. P SMP fl. instrucciones C 1 N bus memoria compartida SISD 1 MP flujo datos P N SIMD MIMD MPP/NUMA Clusters C M Array Vectorial red general memoria distribuida Arquitectura de los sistemas paralelos

  3. Evolución de las arquitecturas Un procesador (vectorial) Sistemas SMP / sistemas SIMD Sistemas masivamente paralelosMPP Las mejores prestaciones (velocidad de cálculo): comunicación de baja latencia y elevado ancho de banda, en algunos casos procesadores con diseño específico, software de control muy optimizado, etc. Perocoste muy elevado. Clusters

  4. Top500 (www.top500.org) Lista de los 500 supercomputadores más rápidos del mundo ejecutando el banco de pruebas LINPACK. Sistemas de ecuaciones lineales densos (cálculo matricial). Permite obtener velocidades muy altas (un máximo virtual). Se mide el valor de Rmax,NmaxyN1/2. También se empieza a medir la potenciaconsumida.

  5. Top500 Cada 6 meses desde 1993 (junio/noviembre) Lista nº 40 - noviembre 2012 Más o menos aceptado por todos los fabricantes. Análisis de tendencias / evolución del mercado.

  6. Top500 Evolución de la velocidad de cálculo Top5+ Fabricantes Procesador: arquitectura / familia / número Sistema: arquitectura / red / S.O. Utilización

  7. ×1,9/año Top500 162,1 PF/s 14.885.800 cores (29.771 c. - 10,9 GF/s) Titan K-computer Sequoia Tianhe-1A RoadRunner Jaguar BlueGene NEC Earth Sim. IBM ASCI White LLNL Intel ASCI Red SandiA 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015

  8. Top5 (diciembre 12) Más BueGene/Q: (4): Mira, 48x, USA; (5) JUQUEEN, 24x, Juelich; (9) Fermi, 10x, Bologna

  9. Top500 fabricante del sistema

  10. Top500

  11. Top500 arquitectura del procesador 217: Earth Simulator 2, NEC – 0,12 PF/s – 1.280 cores

  12. Top500

  13. Top500 familia de procesadores

  14. Top500 Num. cores (mpp / cluster)

  15. Top500 Sequoia ASCI Red Titan Earth Sim. CM5 T3E T3D Blue Gene Paragon RoadRunner CM2 SP2 Jaguar Sun HPC Tianhe-1A Y-MP C90 K computer VP500

  16. Top500 arquitectura del sistema un año → x 2,20 x 1,6

  17. Top500

  18. Top500 Red de conexión

  19. Top500

  20. Top500

  21. Top500 área de utilización

  22. Top500

  23. Top500

  24. Top500: España/Francia (dic. - 12) • Mare NostrumIBM iDataPlex, Xeon E5 (8c), Infiniband FDR • 33.664 cores – 637 TF/s • 290 BSC Bull, cluster (Infin.) – 5.544 cores – 103 TF/s • >> 39.208 cores – 0,7 PF/s (0,3%) 11 Curie thin nodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 c. – 1.359 TF/s 20 Tera-100, CEA Bullx super-node S6010/S6030, Infniband, 138.368 c. – 1.050 TF/s 31/32 BlueGene/Q Power BQC, 65.536 c. - 690 TF/s … Total: 21 sistemas (EDF, Airbus, CINES, Total,…) >> 620.248 c.- 6,5 PF/s (4%) • >> Europa: Alemania (19 - 10,2 PF/s), G.B. (24 – 7,3 PF/s),Italia(7 - 2,4 PF/s) • Total: 31,2 PF/s (20%)

  25. El cluster ARINA de la UPV/EHU Arina, Arinaz (260 núcleos, Itanium2) Guinness (440 núcleos, Xeon) Maiz (40 núcleos, Opteron) Sistema paralelo de ficheros (SFS) 4 servidores 4,7 TB / 7,1 TB Infiniband, 1 GB/s

  26. El cluster ARINA de la UPV/EHU

  27. CFX, dinámica de fluidos MOLCAS, estructura molecular ADF, estr. electrónica de las moleculas WIEN2K, estr. electrónica de sólidos Qsite, proteínas NBO5-NBOView, enlaces moleculares El cluster ARINA de la UPV/EHU Aplicaciones En general, de química, física y biología. Software adquirido:

  28. Laboratorio de Paralelismo Cluster del laboratorio 32 + 3×4 procesadores (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC

  29. Titan

  30. Cray Jaguar

  31. Cray Jaguar

  32. K computer

  33. Tianhe-1A

  34. Tianhe-1A

  35. Nebulae

  36. Hopper

  37. Tera-100

  38. RoadRunner Cell

  39. RoadRunner

  40. RoadRunner

  41. RoadRunner

  42. RoadRunner

  43. RoadRunner

  44. RoadRunner

  45. JuGene - BlueGene/P

  46. JuGene - BlueGene/P

  47. BlueGene/L 15 way fully assoc. pref. caches 11 GB/s 27 GB/s 5,5 GB/s 22 GB/s 5,5 GB/s

  48. BlueGene/L

  49. BlueGene/L 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s bisección tr (max) = 69 ns cut-through adaptativo deadlock-free active messages

  50. BlueGene/L

More Related