1 / 62

Sima Dezső

Többmagos/sokmagos pro cess z or ok. Sima Dezső. 2008. November. Áttekintés. 1. Többmagos processzorok megjelenésének szükségszerűsége. 2. Homog én többmagos processzorok. 2.1 Hagyományos többmagos processzorok. 2.2 Sokmagos processzorok. 3. Heterog én többmagos processzorok.

yoshi-walls
Download Presentation

Sima Dezső

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Többmagos/sokmagosprocesszorok Sima Dezső 2008. November

  2. Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 2.2 Sokmagos processzorok 3. Heterogén többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés

  3. 1. Többmagos processzorok megjelenésének szükségszerűsége

  4. 1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years 1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése

  5. 1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Két évente (Lineáris zsugorítás~ 0.7x/2 év) • azonos tranzisztorszám ½ Si területen • azonos területen 2x annyi tranzisztor Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma Moore szabály

  6. 1. Többmagos processzorok megjelenésének szükségszerűsége (3) 1.2 ábra: A lapkán integrált tranzisztorok számának növekedése – a Moore szabály

  7. 1. Többmagos processzorok megjelenésének szükségszerűsége (4) 4 2 1 Possible use of surplus transistors Wider processor width Core enhancements Cache enhancements L2/L3 enhancements (size, associativity ...) • branch prediction • speculative loads • ... pipeline superscalar 1. Gen. 2. Gen. Mire használhatók fel a többlet-tranzisztorok? A tranzisztorszámok duplázódása ~ két évente Moore szabály

  8. 1. Többmagos processzorok megjelenésének szükségszerűsége (5) Egyre csökkenő teljesítményhozam Növekvő tranzisztorszámok A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége

  9. 1. Többmagos processzorok megjelenésének szükségszerűsége (6) 1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése

  10. 1. Többmagos processzorok megjelenésének szükségszerűsége (7) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 1.4 ábra: Többmagos processzorok főbb osztályai

  11. 2. Homogén többmagos processzorok

  12. 2. Homogén többmagos procdesszorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.1 ábra: Többmagos processzorok főbb osztályai

  13. 2.1 Többmagos MP szerver processzorok (1) Többmagos MP szerver processzorok Intel MP szerver processzorai AMD MP szerver processzorai

  14. 2.1 - Többmagos MP szerver processzorok (2) Többmagos négyprocesszoros MP szerverek megjelenésének mérföldkövei 2006: Intel: Netburst-alapú DC MP szerver (8500 platform) 2007: Intel: Core 2-alapú QC MP szerver (7300 platform) 2005: AMD: K8-alapú DC MP szerver (Opteron 800 család) 2006: AMD: K8-alapú DC MP szerver (Opteron 8000 család) 2007: AMD: K10 (Barcelona)-alapú QC MP szerver (Opteron 8300 család)

  15. 2.1Többmagos MP szerver processzorok (3) Intel többmagos MP szerver processzorai

  16. 2.1 – Intel többmagos MP szerver processzorai (1) Intel’s DC/QC MP-servers 9/2007 3/2006 8500 7300 (Truland) (Caneland) QC DC 11/2005 8/2006 9/2007 9/2007 Cores Xeon 7200 Xeon 7100 Xeon 7000 Xeon 7300 (Paxville MP DC) (Tulsa DC) (Tigerton DC) (Tigerton QC) 3/2006 9/2007 4/2006 8500 7300 8501 MP Chipsets (?) (Clarksboro) (Twin Castle) 4xFSB 1066 MT/s 4 x FBDIMM (DDR2) 512GB 2xFSB 800 MT/s 4 x XMB (2 x DDR2) 32GB 2xFSB 667 MT/s 4 x XMB (2 x DDR2) 32GB 2.2 ábra: Intel négyfoglalatos DC/QC MP platformjai (magok, lapkák)

  17. 2.1 – Intel többmagos MP szerver processzorai (2) 2005: 2006: Paxville MP Tulsa Paxville MP Tulsa Paxville MP Tulsa Paxville MP Tulsa Potomac Potomac Potomac Potomac SC SC SC SC DC DC DC DC Preceding NB (Twin Castle) XMB XMB 8500 DDR/ DDR2 DDR/ DDR2 XMB XMB 2007: Tigerton Tigerton Tigerton Tigerton DC/QC DC/QC DC/QC DC/QC Clarksboro FBDIMM/DDR2 2.3 ábra: Intel MP szerver lapka készleteinek fejlődése

  18. 2.1 – Intel többmagos MP szerver processzorai (3) Xeon 7200 (Tigerton DC, Core2), DC 7300 (Tigerton QC, Core2), QC FB-DIMM up to 512 GB 2.4 ábra: Intel négyfoglalatos 7300-as (Caneland) platformja (9/2007)

  19. 2.1 – Intel többmagos MP szerver processzorai (4) Xeon FB-DIMM DDR2 192 GB 7200 DC 7300 QC (Tigerton) 7300 NB SBE2 SB 2.5 ábra: Négyfoglalatos 7300 (Caneland) alaplap (Supermicro X7QC3)

  20. AMDtöbbmagos MP szerver processzorai

  21. 2.1 – AMD többmagos MP szerver processzorai (1) CPU0 CPU1 CPU0 CPU1 1MB L2 Cache 1MB L2 Cache 1MB L2 Cache 1MB L2 Cache System Request Interface System Request Interface Crossbar Switch Crossbar Switch HyperTransport™ Memory Memory HT Controller Controller 0 1 2 800/8000: 3 coherent links 200/2000: 1 coherent link 2 x 72 bit 2 x 72 bit UP: Opteron 100/1000 DP: Opteron 200/2000, MP: 800/8000 2.6 ábra: Az Opteron család alapvető felépítése

  22. 2.1 – AMD többmagos MP szerver processzorai (2) 2.7 ábra: AMD 4P/8P Direct Connect szerver architektúrája

  23. 2.2 Sokmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.8 ábra: Többmagos processzorok főbb osztályai

  24. 2.2 Sokmagos processzorok 2.2 Sokmagos processzorok Intel Larrabee processzora (Intel Tiled processszora)

  25. 2.2 Sokmagos processzorok - Larrabee (1) Intel Larrabee processzora

  26. 2.2 Sokmagos processzorok - Larrabee (2) Larrabee Intel’s Tera-Scale kezdeményezésének részeként. • Célok: Nagyteljesítményű grafikai processzor, HPC Nem egyetlen termék, hanem több család alapjául szolgáló bázis architektúra. • Előzmények: Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Várható megjelenés ~ 2009 • Teljesítmény (cél): • 2 TFlops

  27. 2.2 Sokmagos processzorok - Larrabee (3) Basic architecture 2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) 16-byte széles SIMD feldolgozó egységek

  28. 2.2 Sokmagos processzorok - Larrabee (4) 2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)

  29. 2.2 Sokmagos processzorok - Larrabee (5) CSI: Common Systems Interface (csomagalapú soros IF) 2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája

  30. 2.2 Sokmagos processzorok – Tiled processzor (1) Intel Tiled processzora

  31. 2.2 Sokmagos processzorok – Tiled processzor (2) Processzor • Intel Tera-Scale kezdeményezésének első megvalósítása (több, mint 100 projekt között) • Cél: Tera-Scale kísérleti chip • Előzmények: Bejelentése IDF 9/2006 Várható megjelenése 2009/2010

  32. 2.2 Sokmagos processzorok – Tiled processzor (3) 2.12 ábra: A Tiled processzor alapvető felépítése

  33. 3. Heterogén többmagos processzorok

  34. 3.1 Heterogén mester/szolga elvű többmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 3.1 ábra Többmagos processzorok főbb osztályai

  35. 3. Heterogén többmagos processzorok 3.1 Heterogén többmagos mester/szolga elvű TP-ok A Cell processzor

  36. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (1) Cell BE • Sony, IBM és Toshiba közös terméke • Cél: Játékok/multimédia, HPC alkalmazások Playstation 3 (PS3) QS2x Blade Szerver család (2 Cell BE/blade) • Előzmények: 2000 nyara: Az architektúra alapjainak meghatározása 02/2006: Cell Blade QS20 08/ 2007 Cell Blade QS21 05/ 2008 Cell Blade QS22

  37. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (2) SPE: Synergistic Procesing Element SPU: Synergistic Processor Unit SXU: Synergistic Execution Unit LS: Local Store of 256 KB SMF: Synergistic Mem. Flow Unit EIB: Element Interface Bus PPE: Power Processing Element PPU: Power Processing Unit PXU: POWER Execution Unit MIC: Memory Interface Contr. BIC: Bus Interface Contr. XDR: Rambus DRAM 3.2 ábra: A Cell BE blokk diagramja

  38. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (3) 3.3 ábra: A Cell BE lapka (221mm2, 234 mtrs)

  39. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (4) 3.10 ábra: A Cell BE lapka - EIB

  40. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (5) 3.11 ábra: Az EIB működési elve

  41. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (6) 3.12 ábra: Konkurens átvitelek az EIB-en

  42. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (7) • Teljesítmény @ 3.2 GHz: QS21 Csúcs SP FP: 409,6 GFlops (3.2 GHz x 2x8 SPE x 2x4 SP FP/cycle) • Cell BE - NIK 2007: Faculty Award (Cell 3Đ app./Teaching) 2008: IBM – NIK Kutatási Együttműködési Szerződés: Teljesítményvizsgálatok • IBM Böblingen Lab • IBM Austin Lab

  43. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (8) The Roadrunner 6/2008 : International Supercomputing Conference, Dresden A világ 500 leggyorsabb számítógépe 1. Roadrunner 1 Petaflops (1015) fenntartott teljesítmény (linpack)

  44. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (9) 3.13 ábra:A világ leggyorsabb számítógépe: IBM Roadrunner (Los Alamos 2008)

  45. 3.1 Heterogén mester/szolga elvű TP-ok - A Cell (10) 3.14 ábra: A Roadrunner főbb jellemzői

  46. 3.2 Heterogén csatolt többmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 3.15 ábra: Többmagos processzorok főbb jellemzői

  47. 3. Heterogén többmagos processzorok 3.2 Heterogén csatolt többmagos processzorok

  48. 3.2 Heterogén csatolt többmagos processzorok (2) Ötlet A jelenlegi GPUk (Graphics Prtocessing Units) hatalmas számítási teljesítményűek,pl. • NVIDIA GeForce GTX 260/280 (2008) • AMD/ATI FireStream 9250 (6/2008)

  49. 3.2 Heterogén csatolt többmagos processzorok (3) 3.16 ábra: CPU-k és GPU-k egyszeresen pontos LP csúcsteljesítménye

  50. 3.2 Heterogén csatolt többmagos processzorok (4) 3.17 ábra: CPUk és GPUk memória sávszélessége [GB/s]

More Related