510 likes | 637 Views
Többmagos/sokmagos pro cess z or ok-1. Sima Dezső. 20 12 . Október. Version 3.0. Áttekintés. 1. Többmagos processzorok megjelenésének szükségszerűsége. 2. Homog én többmagos processzorok. 2.1 Hagyományos többmagos processzorok. 2.2 Sokmagos processzorok.
E N D
Többmagos/sokmagosprocesszorok-1 Sima Dezső 2012. Október Version 3.0
Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 2.2 Sokmagos processzorok 3. Heterogén többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés
1. Többmagos processzorok megjelenésének szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years 1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése
1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Két évente (Jelenleg: lineáris zsugorítás~ 0.7x/2 év) • azonos tranzisztorszám ½ Si területen • azonos területen 2x annyi tranzisztor Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (3) 4 2 1 Possible use of surplus transistors Wider processor width Core enhancements Cache enhancements L2/L3 enhancements (size, associativity ...) • branch prediction • speculative loads • ... pipeline superscalar 1. Gen. 2. Gen. Mire használhatók fel a többlet-tranzisztorok a mikroarchitektúra fejlesztésében? A tranzisztorszámok duplázódása ~ két évente Moore szabály
1. Többmagos processzorok megjelenésének szükségszerűsége (4) Egyre csökkenő teljesítményhozam Növekvő tranzisztorszámok A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége
1. Többmagos processzorok megjelenésének szükségszerűsége (5) 1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése
1. Többmagos processzorok megjelenésének szükségszerűsége (7) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 1.4 ábra: Többmagos processzorok főbb osztályai
2. Homogén többmagos procdesszorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.1 ábra: Többmagos processzorok főbb osztályai
2.2 Sokmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.8 ábra: Többmagos processzorok főbb osztályai
2.2 Sokmagos processzorok 2.2 Sokmagos processzorok 2.2.1 Intel Larrabee processzora 2.2.2 Intel Tiled processszora 2.2.3 Intel SCC 2.2.4 Intel MIC
2.2.1Intel Larrabee processzora (1) 2.2.1 Intel Larrabee processzora
2.2.1Intel Larrabee processzora (2) Larrabee Intel’s Tera-Scale kezdeményezésének részeként. • Célok: Nagyteljesítményű grafikai processzor, HPC Nem egyetlen termék, hanem egytermékcsalád alapjául szolgáló bázis architektúra. • Előzmények: Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Bejelentett megjelenés ~ 2009 Visszavonás: 2010 vége • Teljesítmény (cél): • 2 TFlops
2.2.1Intel Larrabee processzora (3) Basic architecture 2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) 16-byte széles SIMD feldolgozó egységek
2.2.1Intel Larrabee processzora (4) Multi GPU? 2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)
2.2.1Intel Larrabee processzora (5) CSI: Common Systems Interface (csomagalapú soros IF) 2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája
2.2.2Intel 80-magos Tile processzora (1) 80-magos Tile Processzor • Intel Tera-Scale kezdeményezésének első megvalósítása (több, mint 100 projekt között) • Cél: Tera-Scale kísérleti chip • Előzmények: Bejelentése IDF 9/2006 Megjelenése 2/2007
2.2.2Intel 80-magos Tile processzora (2) Intel Bisection bandwidth: If the network is segmented into two equal parts, this is the bandwidth between the two parts Mezosynchronous clock Same clock frequency,different phase
2.2.2Intel 80-magos Tile processzora (4) Intel (Clocks run with the same frequency but unknown phases FP Multiply-Accumulate (AxB+C)
2.2.2Intel 80-magos Tile processzora (5) Figure: On board implementation of the 80-core Tile Processor http://www.legitreviews.com/article/460/1/
2.2.2Intel 80-magos Tile processzora (6) WIMP stands for "window, icon, menu, pointing device", Intel
2.2.2Intel 80-magos Tile processzora (8) Intel VLIW
2.2.2Intel 80-magos Tile processzora (10) Intel (Pentium II)
2.2.2Intel 80-magos Tile processzora (11) Intel NoC: No Cache
2.2.3IntelSCC (Single-chip Cloud Computer) (1) Intel SCC (Single-chip Cloud Computer) • 12/2009: Announced • 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC • platform • Designed in Braunschweig and Bangalore • 48 core, 2D-mesh system topology, message passing
2.2.3IntelSCC (Single-chip Cloud Computer) (3) Intel (350 nm)
2.2.3IntelSCC (Single-chip Cloud Computer) (4) Intel (Joint Test Action Group) Standard Test Access Port
2.2.3IntelSCC (Single-chip Cloud Computer) (9) Intel (Message Passing Buffer)
2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi (Knights Corner)
2.2.4 Intel MIC (Many Integrated Cores) (1) Bevezetés A Larrabee projekt továbbfejlesztése Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”) Bejelentés: 5/2010 (International Supercomputing Conference) Gyártás: 2012 vége 50 mag, 22 nm
2.2.4 Intel MIC (Many Integrated Cores) (2) https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (3) https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf
2.2.4 Intel MIC (Many Integrated Cores) (4) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (5) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (6) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (7) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012
2.2.4 Intel MIC (Many Integrated Cores) (8) Heavily customized Pentium P54C G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012