1 / 51

Sima Dezső

Többmagos/sokmagos pro cess z or ok-1. Sima Dezső. 20 12 . Október. Version 3.0. Áttekintés. 1. Többmagos processzorok megjelenésének szükségszerűsége. 2. Homog én többmagos processzorok. 2.1 Hagyományos többmagos processzorok. 2.2 Sokmagos processzorok.

Download Presentation

Sima Dezső

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Többmagos/sokmagosprocesszorok-1 Sima Dezső 2012. Október Version 3.0

  2. Áttekintés 1. Többmagos processzorok megjelenésének szükségszerűsége 2. Homogén többmagos processzorok 2.1 Hagyományos többmagos processzorok 2.2 Sokmagos processzorok 3. Heterogén többmagos processzorok 3.1 Mester/szolga elvű többmagos processzorok 3.2 Csatolt többmagos processzorok 4. Kitekintés

  3. 1. Többmagos processzorok megjelenésének szükségszerűsége

  4. 1. Többmagos processzorok megjelenésének szükségszerűsége (1) Shrinking: ~ 0.7/2 Years 1.1 ábra: Az integrált áramkörök gyártási technológiájának fejlődése

  5. 1. Többmagos processzorok megjelenésének szükségszerűsége (2) IC gyártási technológia Két évente (Jelenleg: lineáris zsugorítás~ 0.7x/2 év) • azonos tranzisztorszám ½ Si területen • azonos területen 2x annyi tranzisztor Kétévente kb. duplázódik az egy lapkán megvalósítható ltranzisztorok száma Moore szabály

  6. 1. Többmagos processzorok megjelenésének szükségszerűsége (3) 4 2 1 Possible use of surplus transistors Wider processor width Core enhancements Cache enhancements L2/L3 enhancements (size, associativity ...) • branch prediction • speculative loads • ... pipeline superscalar 1. Gen. 2. Gen. Mire használhatók fel a többlet-tranzisztorok a mikroarchitektúra fejlesztésében? A tranzisztorszámok duplázódása ~ két évente Moore szabály

  7. 1. Többmagos processzorok megjelenésének szükségszerűsége (4) Egyre csökkenő teljesítményhozam Növekvő tranzisztorszámok A többlet tranzisztorok felhasználása többmagos processzorként A többmagos processzorok megjelenésének szükségszerűsége

  8. 1. Többmagos processzorok megjelenésének szükségszerűsége (5) 1.3 ábra: Intel többmagos processzorainak robbanásszerű elterjedése

  9. 1. Többmagos processzorok megjelenésének szükségszerűsége (7) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 1.4 ábra: Többmagos processzorok főbb osztályai

  10. 2. Homogén többmagos processzorok

  11. 2. Homogén többmagos procdesszorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.1 ábra: Többmagos processzorok főbb osztályai

  12. 2.2 Sokmagos processzorok (1) GPU CPU MPC Multicore processors Homogenous multicores Heterogenous multicores Conventional MC processors Manycore processors Master/slave architectures Add-on architectures 2 ≤ n ≤ 8 cores with >8 cores Desktops Servers General purpose computing Prototypes/ experimental systems MM/3D/HPC production stage HPC near future 2.8 ábra: Többmagos processzorok főbb osztályai

  13. 2.2 Sokmagos processzorok 2.2 Sokmagos processzorok 2.2.1 Intel Larrabee processzora 2.2.2 Intel Tiled processszora 2.2.3 Intel SCC 2.2.4 Intel MIC

  14. 2.2.1Intel Larrabee processzora (1) 2.2.1 Intel Larrabee processzora

  15. 2.2.1Intel Larrabee processzora (2) Larrabee Intel’s Tera-Scale kezdeményezésének részeként. • Célok: Nagyteljesítményű grafikai processzor, HPC Nem egyetlen termék, hanem egytermékcsalád alapjául szolgáló bázis architektúra. • Előzmények: Projekt kezdete ~ 2005 Az első nem nyilvános prezentáció: 03/2006 (visszavonva) Az első nyilvános prezentáció: 08/2008 (SIGGRAPH) Bejelentett megjelenés ~ 2009 Visszavonás: 2010 vége • Teljesítmény (cél): • 2 TFlops

  16. 2.2.1Intel Larrabee processzora (3) Basic architecture 2.9 ábra: A GPU-orientált Larrabe blokk diagramja (2008 aug. SIGGRAPH) 16-byte széles SIMD feldolgozó egységek

  17. 2.2.1Intel Larrabee processzora (4) Multi GPU? 2.10 ábra: GPU-orientált Larrabee alaplapja (2006, túlhaladott)

  18. 2.2.1Intel Larrabee processzora (5) CSI: Common Systems Interface (csomagalapú soros IF) 2.11 ábra: Négyfoglalatos MP szerver célú Larrabee rendszer architektúrája

  19. 2.2.2 Intel 80-magos Tile processzora

  20. 2.2.2Intel 80-magos Tile processzora (1) 80-magos Tile Processzor • Intel Tera-Scale kezdeményezésének első megvalósítása (több, mint 100 projekt között) • Cél: Tera-Scale kísérleti chip • Előzmények: Bejelentése IDF 9/2006 Megjelenése 2/2007

  21. 2.2.2Intel 80-magos Tile processzora (2) Intel Bisection bandwidth: If the network is segmented into two equal parts, this is the bandwidth between the two parts Mezosynchronous clock Same clock frequency,different phase

  22. 2.2.2Intel 80-magos Tile processzora (3) Intel

  23. 2.2.2Intel 80-magos Tile processzora (4) Intel (Clocks run with the same frequency but unknown phases FP Multiply-Accumulate (AxB+C)

  24. 2.2.2Intel 80-magos Tile processzora (5) Figure: On board implementation of the 80-core Tile Processor http://www.legitreviews.com/article/460/1/

  25. 2.2.2Intel 80-magos Tile processzora (6) WIMP stands for "window, icon, menu, pointing device", Intel

  26. 2.2.2Intel 80-magos Tile processzora (7) Intel

  27. 2.2.2Intel 80-magos Tile processzora (8) Intel VLIW

  28. 2.2.2Intel 80-magos Tile processzora (9) Intel

  29. 2.2.2Intel 80-magos Tile processzora (10) Intel (Pentium II)

  30. 2.2.2Intel 80-magos Tile processzora (11) Intel NoC: No Cache

  31. 2.2.2Intel 80-magos Tile processzora (12) Intel

  32. 2.2.3 Intel SCC (Single-chip Cloud Computer)

  33. 2.2.3IntelSCC (Single-chip Cloud Computer) (1) Intel SCC (Single-chip Cloud Computer) • 12/2009: Announced • 9/2010: Many-core Application Research Project (MARC) initiative started on the SCC • platform • Designed in Braunschweig and Bangalore • 48 core, 2D-mesh system topology, message passing

  34. 2.2.3IntelSCC (Single-chip Cloud Computer) (2) Intel

  35. 2.2.3IntelSCC (Single-chip Cloud Computer) (3) Intel (350 nm)

  36. 2.2.3IntelSCC (Single-chip Cloud Computer) (4) Intel (Joint Test Action Group) Standard Test Access Port

  37. 2.2.3IntelSCC (Single-chip Cloud Computer) (5) Intel

  38. 2.2.3IntelSCC (Single-chip Cloud Computer) (6) 2009

  39. 2.2.3IntelSCC (Single-chip Cloud Computer) (7) 2009

  40. 2.2.3IntelSCC (Single-chip Cloud Computer) (8) Intel

  41. 2.2.3IntelSCC (Single-chip Cloud Computer) (9) Intel (Message Passing Buffer)

  42. 2.2.4 Intel MIC (Many Integrated Cores) - Xeon Phi (Knights Corner)

  43. 2.2.4 Intel MIC (Many Integrated Cores) (1) Bevezetés A Larrabee projekt továbbfejlesztése Cél: Adatpárhuzamos gyorsító (GPGPU-k “kiszorítására”) Bejelentés: 5/2010 (International Supercomputing Conference) Gyártás: 2012 vége 50 mag, 22 nm

  44. 2.2.4 Intel MIC (Many Integrated Cores) (2) https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf

  45. 2.2.4 Intel MIC (Many Integrated Cores) (3) https://www-304.ibm.com/services/learning/content/pdfs/IBM_May_9th_2012_Business_Partners_-_Intel_MIC_Overview_Public_Deck.pdf

  46. 2.2.4 Intel MIC (Many Integrated Cores) (4) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012

  47. 2.2.4 Intel MIC (Many Integrated Cores) (5) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012

  48. 2.2.4 Intel MIC (Many Integrated Cores) (6) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012

  49. 2.2.4 Intel MIC (Many Integrated Cores) (7) G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012

  50. 2.2.4 Intel MIC (Many Integrated Cores) (8) Heavily customized Pentium P54C G. Chrysos, Intel Xeon Phi Coprocessor, Hot Chips 2012

More Related