1 / 67

9. OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera).

9. OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera). Abiadura handiko konputagailuak (top500 zerrenda). P. agindu-jarioak. SMP. 1. N. C. busa. SISD. 1. memoria partekatua. M N. datu-jarioak. N. MIMD. SIMD. P. MPP/NUMA Clusters. C. M. Prozesatze-matrizeak

elvis
Download Presentation

9. OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera).

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 9.OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera). Abiadura handiko konputagailuak (top500 zerrenda).

  2. P agindu-jarioak SMP 1 N C busa SISD 1 memoria partekatua MN datu-jarioak N MIMD SIMD P MPP/NUMA Clusters C M Prozesatze-matrizeak Bektore-konputagailuak sare orokorra memoria banatua Sistema paraleloen arkitektura

  3. Arkitekturen eboluzioa Prozesadore bakar bat (bektoriala) SMP sistemak / SIMD sistemak Sistema paralelo masiboak, MPP Ezaugarri onenak (kalkulu-abiadura): latentzia txikiko eta banda-zabalera handiko komunikazioak, diseinu bereziko prozesadoreak (batzuetan), kontrol-software oso optimizatua... Bainaoso garestiak. Cluster-ak

  4. Top500(www.top500.org) Munduko 500 konputagailu azkarrenen zerrenda (LINPACK proba-bankua exekutatuz). Ekuazio linealen sistema trinkoak (matrize-kalkulua). Kalkulu-abiadura handiak lor daitezke (maximo birtual bat). Rmax,Nmax,N1/2 parametroak neurtzen dira. Kontsumitzen den potentzia ere hasi da kontuan hartzen.

  5. Top500 6 hilean behin, 1993tik (ekainean eta azaroan) 40. zerrenda – 2012ko azaroa Fabrikatzaile guztiak gutxi-asko onartua Joeren analisia / merkatuaren eboluzioa

  6. Top500 Kalkulu-abiaduraren eboluzioa Top5+ Fabrikatzaileak Prozesadoreak: arkitektura / familia / kopurua Sistema:arkitektura / sarea / S.E. Erabilera

  7. ×1,9/urte Top500 162,1 PF/s 14.885.800 nukleo (29.771 n. - 10,9 GF/s) Titan K-computer Sequoia Tianhe-1A RoadRunner Jaguar BlueGene NEC EarthSim. IBM ASCI White LLNL Intel ASCI Red SandiA 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015

  8. Top5 (12ko abendua) BlueGene/Q gehiago: (4): Mira, 48x, USA; (5) JUQUEEN, 24x,Juelich; (9) Fermi, 10x, Bologna

  9. Top500 Sistemaren fabrikatzailea

  10. Top500

  11. Top500 Prozesadoreen arkitektura 217: Earth Simulator 2, NEC - 0,12 PF/s - 1.280 nukleo

  12. Top500

  13. Top500 Prozesadore-familia

  14. Top500 Nukleokopurua (mpp / cluster)

  15. Top500 Sequoia ASCI Red Titan EarthSim. CM5 T3E T3D Blue Gene Paragon RoadRunner CM2 SP2 Jaguar SunHPC Tianhe-1A Y-MP C90 K computer VP500

  16. Top500 Sistemaren arkitektura urtebat → x 2,2x 1,6

  17. Top500

  18. Top500 Komunikazio-sarea

  19. Top500

  20. Top500

  21. Top500 Erabilera

  22. Top500

  23. Top500

  24. Top500: Espainia/Frantzia (12ko abendua) • Mare NostrumIBM iDataPlex, Xeon E5 (8c), InfinibandFDR • 33.664 nukl. – 637 TF/s • 290 BSCBull, cluster (Infin.) –5.544 nukl. – 103 TF/s • >>39.208 nukl. – 0,7 PF/s (% 0,3) 11 Curie thinnodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 nukl. – 1.359 TF/s 20 Tera-100, CEA Bullxsuper-nodeS6010/S6030, Infniband, 138.368 nukl. – 1.050 TF/s 31/32 BlueGene/Q PowerBQC, 65.536 nukl. - 690 TF/s … Guztira: 21 sistema (EDF, Airbus, CINES, Total,…) >> 620.248 nukl.- 6,5 PF/s (% 4) • >> Europa: Alemania (19 - 10,2 PF/s), B.H.(24 – 7,3 PF/s),Italia (7 - 2,4 PF/s) • Guztira: 31,2 PF/s (%20)

  25. EHUko ARINA cluster-a Arina, Arinaz (260 nukleo, Itanium2) Guinness (440 nukelo, Xeon) Maiz (40 nukleo, Opteron) Fitxategi paraleloko sistema (SFS) 4 zerbitzari 4,7 TB / 7,1 TB Infiniband, 1 GB/s

  26. EHUko ARINA cluster-a

  27. CFX, fluidoen dinamika MOLCAS, molekulen egitura ADF, molekulen egitura elektronikoa WIEN2K, solidoen egitura elektronikoa Qsite, proteinak NBO5-NBOView, molekula-loturak EHUko ARINA cluster-a Aplikazioak Oro har, kimika, fisika eta biologia arlokoak. Erosi den softwarea:

  28. Paralelismoko Laborategia Laborategiko cluster-a 32 + 3×4 prozesadore (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC

  29. Titan

  30. Cray Jaguar

  31. Cray Jaguar

  32. K computer

  33. Tianhe-1A

  34. Tianhe-1A

  35. Nebulae

  36. Hopper

  37. Tera-100

  38. RoadRunner Cell

  39. RoadRunner

  40. RoadRunner

  41. RoadRunner

  42. RoadRunner

  43. RoadRunner

  44. RoadRunner

  45. JuGene - BlueGene/P

  46. JuGene - BlueGene/P

  47. BlueGene/L 15 way fully assoc. pref. caches 11 GB/s 27 GB/s 5,5 GB/s 22 GB/s 5,5 GB/s

  48. BlueGene/L

  49. BlueGene/L 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s erdibiketa tr (max) = 69 ns cut-through moldakorra deadlock-free active messages

  50. BlueGene/L

More Related