630 likes | 761 Views
Többmagos/sokmagos pro cess z or ok. Sima Dezső. 2008. November. Áttekintés. 1. Többmagos processzorok megjelenésének szükségszerűsége. 2. Homog én többmagos processzorok. 2.1 Hagyományos többmagos processzorok. 2.2 Sokmagos processzorok. 3. Heterog én többmagos processzorok.
E N D
Többmagos/sokmagosprocesszorok Sima Dezső 2008. November
Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 2.2 Sokmagos processzorok 3. Heterogén többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés
1. Többmagos processzorok megjelenésének szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years 1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése
1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Két évente (Lineáris zsugorítás~ 0.7x/2 év) • azonos tranzisztorszám ½ Si területen • azonos területen 2x annyi tranzisztor Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (3) 1.2 ábra: A lapkán integrált tranzisztorok számának növekedése – a Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (4) 4 2 1 Possible use of surplus transistors Wider processor width Core enhancements Cache enhancements L2/L3 enhancements (size, associativity ...) • branch prediction • speculative loads • ... pipeline superscalar 1. Gen. 2. Gen. Mire használhatók fel a többlet-tranzisztorok? A tranzisztorszámok duplázódása ~ két évente Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (5) Egyre csökkenő teljesítményhozam Növekvő tranzisztorszámok A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (6) 1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése
1. Többmagos processzorok megjelenésének szükségszerűsége (7) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 1.4 ábra: Többmagos processzorok főbb osztályai
2. Homogén többmagos procdesszorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.1 ábra: Többmagos processzorok főbb osztályai
2.1 Többmagos MP szerver processzorok (1) Többmagos MP szerver processzorok Intel MP szerver processzorai AMD MP szerver processzorai
2.1 - Többmagos MP szerver processzorok (2) Többmagos négyprocesszoros MP szerverek megjelenésének mérföldkövei 2006: Intel: Netburst-alapú DC MP szerver (8500 platform) 2007: Intel: Core 2-alapú QC MP szerver (7300 platform) 2005: AMD: K8-alapú DC MP szerver (Opteron 800 család) 2006: AMD: K8-alapú DC MP szerver (Opteron 8000 család) 2007: AMD: K10 (Barcelona)-alapú QC MP szerver (Opteron 8300 család)
2.1Többmagos MP szerver processzorok (3) Intel többmagos MP szerver processzorai
2.1 – Intel többmagos MP szerver processzorai (1) Intel’s DC/QC MP-servers 9/2007 3/2006 8500 7300 (Truland) (Caneland) QC DC 11/2005 8/2006 9/2007 9/2007 Cores Xeon 7200 Xeon 7100 Xeon 7000 Xeon 7300 (Paxville MP DC) (Tulsa DC) (Tigerton DC) (Tigerton QC) 3/2006 9/2007 4/2006 8500 7300 8501 MP Chipsets (?) (Clarksboro) (Twin Castle) 4xFSB 1066 MT/s 4 x FBDIMM (DDR2) 512GB 2xFSB 800 MT/s 4 x XMB (2 x DDR2) 32GB 2xFSB 667 MT/s 4 x XMB (2 x DDR2) 32GB 2.2 ábra: Intel négyfoglalatos DC/QC MP platformjai (magok, lapkák)
2.1 – Intel többmagos MP szerver processzorai (2) 2005: 2006: Paxville MP Tulsa Paxville MP Tulsa Paxville MP Tulsa Paxville MP Tulsa Potomac Potomac Potomac Potomac SC SC SC SC DC DC DC DC Preceding NB (Twin Castle) XMB XMB 8500 DDR/ DDR2 DDR/ DDR2 XMB XMB 2007: Tigerton Tigerton Tigerton Tigerton DC/QC DC/QC DC/QC DC/QC Clarksboro FBDIMM/DDR2 2.3 ábra: Intel MP szerver lapka készleteinek fejlődése
2.1 – Intel többmagos MP szerver processzorai (3) Xeon 7200 (Tigerton DC, Core2), DC 7300 (Tigerton QC, Core2), QC FB-DIMM up to 512 GB 2.4 ábra: Intel négyfoglalatos 7300-as (Caneland) platformja (9/2007)
2.1 – Intel többmagos MP szerver processzorai (4) Xeon FB-DIMM DDR2 192 GB 7200 DC 7300 QC (Tigerton) 7300 NB SBE2 SB 2.5 ábra: Négyfoglalatos 7300 (Caneland) alaplap (Supermicro X7QC3)
2.1 – AMD többmagos MP szerver processzorai (1) CPU0 CPU1 CPU0 CPU1 1MB L2 Cache 1MB L2 Cache 1MB L2 Cache 1MB L2 Cache System Request Interface System Request Interface Crossbar Switch Crossbar Switch HyperTransport™ Memory Memory HT Controller Controller 0 1 2 800/8000: 3 coherent links 200/2000: 1 coherent link 2 x 72 bit 2 x 72 bit UP: Opteron 100/1000 DP: Opteron 200/2000, MP: 800/8000 2.6 ábra: Az Opteron család alapvető felépítése
2.1 – AMD többmagos MP szerver processzorai (2) 2.7 ábra: AMD 4P/8P Direct Connect szerver architektúrája
2.2 Sokmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.8 ábra: Többmagos processzorok főbb osztályai
2.2 Sokmagos processzorok 2.2 Sokmagos processzorok Intel Larrabee processzora (Intel Tiled processszora)
2.2 Sokmagos processzorok - Larrabee (1) Intel Larrabee processzora
2.2 Sokmagos processzorok - Larrabee (2) Larrabee Intel’s Tera-Scale kezdeményezésének részeként. • Célok: Nagyteljesítményű grafikai processzor, HPC Nem egyetlen termék, hanem több család alapjául szolgáló bázis architektúra. • Előzmények: Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Várható megjelenés ~ 2009 • Teljesítmény (cél): • 2 TFlops
2.2 Sokmagos processzorok - Larrabee (3) Basic architecture 2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) 16-byte széles SIMD feldolgozó egységek
2.2 Sokmagos processzorok - Larrabee (4) 2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)
2.2 Sokmagos processzorok - Larrabee (5) CSI: Common Systems Interface (csomagalapú soros IF) 2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája
2.2 Sokmagos processzorok – Tiled processzor (1) Intel Tiled processzora
2.2 Sokmagos processzorok – Tiled processzor (2) Processzor • Intel Tera-Scale kezdeményezésének első megvalósítása (több, mint 100 projekt között) • Cél: Tera-Scale kísérleti chip • Előzmények: Bejelentése IDF 9/2006 Várható megjelenése 2009/2010
2.2 Sokmagos processzorok – Tiled processzor (3) 2.12 ábra: A Tiled processzor alapvető felépítése
3.1 Heterogén mester/szolga elvű többmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 3.1 ábra Többmagos processzorok főbb osztályai
3. Heterogén többmagos processzorok 3.1 Heterogén többmagos mester/szolga elvű TP-ok A Cell processzor
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (1) Cell BE • Sony, IBM és Toshiba közös terméke • Cél: Játékok/multimédia, HPC alkalmazások Playstation 3 (PS3) QS2x Blade Szerver család (2 Cell BE/blade) • Előzmények: 2000 nyara: Az architektúra alapjainak meghatározása 02/2006: Cell Blade QS20 08/ 2007 Cell Blade QS21 05/ 2008 Cell Blade QS22
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (2) SPE: Synergistic Procesing Element SPU: Synergistic Processor Unit SXU: Synergistic Execution Unit LS: Local Store of 256 KB SMF: Synergistic Mem. Flow Unit EIB: Element Interface Bus PPE: Power Processing Element PPU: Power Processing Unit PXU: POWER Execution Unit MIC: Memory Interface Contr. BIC: Bus Interface Contr. XDR: Rambus DRAM 3.2 ábra: A Cell BE blokk diagramja
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (3) 3.3 ábra: A Cell BE lapka (221mm2, 234 mtrs)
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (4) 3.10 ábra: A Cell BE lapka - EIB
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (5) 3.11 ábra: Az EIB működési elve
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (6) 3.12 ábra: Konkurens átvitelek az EIB-en
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (7) • Teljesítmény @ 3.2 GHz: QS21 Csúcs SP FP: 409,6 GFlops (3.2 GHz x 2x8 SPE x 2x4 SP FP/cycle) • Cell BE - NIK 2007: Faculty Award (Cell 3Đ app./Teaching) 2008: IBM – NIK Kutatási Együttműködési Szerződés: Teljesítményvizsgálatok • IBM Böblingen Lab • IBM Austin Lab
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (8) The Roadrunner 6/2008 : International Supercomputing Conference, Dresden A világ 500 leggyorsabb számítógépe 1. Roadrunner 1 Petaflops (1015) fenntartott teljesítmény (linpack)
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (9) 3.13 ábra:A világ leggyorsabb számítógépe: IBM Roadrunner (Los Alamos 2008)
3.1 Heterogén mester/szolga elvű TP-ok - A Cell (10) 3.14 ábra: A Roadrunner főbb jellemzői
3.2 Heterogén csatolt többmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 3.15 ábra: Többmagos processzorok főbb jellemzői
3. Heterogén többmagos processzorok 3.2 Heterogén csatolt többmagos processzorok
3.2 Heterogén csatolt többmagos processzorok (2) Ötlet A jelenlegi GPUk (Graphics Prtocessing Units) hatalmas számítási teljesítményűek,pl. • NVIDIA GeForce GTX 260/280 (2008) • AMD/ATI FireStream 9250 (6/2008)
3.2 Heterogén csatolt többmagos processzorok (3) 3.16 ábra: CPU-k és GPU-k egyszeresen pontos LP csúcsteljesítménye
3.2 Heterogén csatolt többmagos processzorok (4) 3.17 ábra: CPUk és GPUk memória sávszélessége [GB/s]