670 likes | 856 Views
9. OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera). Abiadura handiko konputagailuak (top500 zerrenda). P. agindu-jarioak. SMP. 1. N. C. busa. SISD. 1. memoria partekatua. M N. datu-jarioak. N. MIMD. SIMD. P. MPP/NUMA Clusters. C. M. Prozesatze-matrizeak
E N D
9.OpenMP eta MPI: programa paraleloak sortzeko “tresnak” (sarrera). Abiadura handiko konputagailuak (top500 zerrenda).
P agindu-jarioak SMP 1 N C busa SISD 1 memoria partekatua MN datu-jarioak N MIMD SIMD P MPP/NUMA Clusters C M Prozesatze-matrizeak Bektore-konputagailuak sare orokorra memoria banatua Sistema paraleloen arkitektura
Arkitekturen eboluzioa Prozesadore bakar bat (bektoriala) SMP sistemak / SIMD sistemak Sistema paralelo masiboak, MPP Ezaugarri onenak (kalkulu-abiadura): latentzia txikiko eta banda-zabalera handiko komunikazioak, diseinu bereziko prozesadoreak (batzuetan), kontrol-software oso optimizatua... Bainaoso garestiak. Cluster-ak
Top500(www.top500.org) Munduko 500 konputagailu azkarrenen zerrenda (LINPACK proba-bankua exekutatuz). Ekuazio linealen sistema trinkoak (matrize-kalkulua). Kalkulu-abiadura handiak lor daitezke (maximo birtual bat). Rmax,Nmax,N1/2 parametroak neurtzen dira. Kontsumitzen den potentzia ere hasi da kontuan hartzen.
Top500 6 hilean behin, 1993tik (ekainean eta azaroan) 40. zerrenda – 2012ko azaroa Fabrikatzaile guztiak gutxi-asko onartua Joeren analisia / merkatuaren eboluzioa
Top500 Kalkulu-abiaduraren eboluzioa Top5+ Fabrikatzaileak Prozesadoreak: arkitektura / familia / kopurua Sistema:arkitektura / sarea / S.E. Erabilera
×1,9/urte Top500 162,1 PF/s 14.885.800 nukleo (29.771 n. - 10,9 GF/s) Titan K-computer Sequoia Tianhe-1A RoadRunner Jaguar BlueGene NEC EarthSim. IBM ASCI White LLNL Intel ASCI Red SandiA 1 PF/s → 2008 10 PF/s → 2011 100 PF/s → 2015
Top5 (12ko abendua) BlueGene/Q gehiago: (4): Mira, 48x, USA; (5) JUQUEEN, 24x,Juelich; (9) Fermi, 10x, Bologna
Top500 Sistemaren fabrikatzailea
Top500 Prozesadoreen arkitektura 217: Earth Simulator 2, NEC - 0,12 PF/s - 1.280 nukleo
Top500 Prozesadore-familia
Top500 Nukleokopurua (mpp / cluster)
Top500 Sequoia ASCI Red Titan EarthSim. CM5 T3E T3D Blue Gene Paragon RoadRunner CM2 SP2 Jaguar SunHPC Tianhe-1A Y-MP C90 K computer VP500
Top500 Sistemaren arkitektura urtebat → x 2,2x 1,6
Top500 Komunikazio-sarea
Top500 Erabilera
Top500: Espainia/Frantzia (12ko abendua) • Mare NostrumIBM iDataPlex, Xeon E5 (8c), InfinibandFDR • 33.664 nukl. – 637 TF/s • 290 BSCBull, cluster (Infin.) –5.544 nukl. – 103 TF/s • >>39.208 nukl. – 0,7 PF/s (% 0,3) 11 Curie thinnodes, CEA Bullx B510 Xeon E5 (8c), Infniband, 77.184 nukl. – 1.359 TF/s 20 Tera-100, CEA Bullxsuper-nodeS6010/S6030, Infniband, 138.368 nukl. – 1.050 TF/s 31/32 BlueGene/Q PowerBQC, 65.536 nukl. - 690 TF/s … Guztira: 21 sistema (EDF, Airbus, CINES, Total,…) >> 620.248 nukl.- 6,5 PF/s (% 4) • >> Europa: Alemania (19 - 10,2 PF/s), B.H.(24 – 7,3 PF/s),Italia (7 - 2,4 PF/s) • Guztira: 31,2 PF/s (%20)
EHUko ARINA cluster-a Arina, Arinaz (260 nukleo, Itanium2) Guinness (440 nukelo, Xeon) Maiz (40 nukleo, Opteron) Fitxategi paraleloko sistema (SFS) 4 zerbitzari 4,7 TB / 7,1 TB Infiniband, 1 GB/s
CFX, fluidoen dinamika MOLCAS, molekulen egitura ADF, molekulen egitura elektronikoa WIEN2K, solidoen egitura elektronikoa Qsite, proteinak NBO5-NBOView, molekula-loturak EHUko ARINA cluster-a Aplikazioak Oro har, kimika, fisika eta biologia arlokoak. Erosi den softwarea:
Paralelismoko Laborategia Laborategiko cluster-a 32 + 3×4 prozesadore (Pentium IV) Gigabit Ethernet OpenMP, MPI, UPC
RoadRunner Cell
BlueGene/L 15 way fully assoc. pref. caches 11 GB/s 27 GB/s 5,5 GB/s 22 GB/s 5,5 GB/s
BlueGene/L 32 x 32 x 64 1,4 Gb/s (x2) 5,6 Tb/s erdibiketa tr (max) = 69 ns cut-through moldakorra deadlock-free active messages