1 / 105

Korszakváltás a processzorok fejlődésében

Korszakváltás a processzorok fejlődésében. Sima Dezső 20 14 őszi félév (verzió 3.5). Áttekintés. 1 Processzorok teljesítménye. 2 A processzorok hatékonysága. 3 A processzorok hatékonyságának stagnálása által kiváltott fejlődési főirányok. 4 Az órafrekvencia erőteljes növelése.

Download Presentation

Korszakváltás a processzorok fejlődésében

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Korszakváltása processzorok fejlődésében Sima Dezső 2014őszi félév (verzió 3.5)

  2. Áttekintés 1 Processzorok teljesítménye 2 A processzorok hatékonysága 3 A processzorok hatékonyságának stagnálása által kiváltott fejlődési főirányok 4 Az órafrekvencia erőteljes növelése 5 A második hatékonysági korlát 6 A disszipációs korlát 7 Párhuzamos buszok frekvenciakorlátja 8 EPIC architektúrák/processzorok 9 Paradigmaváltás

  3. 1.1. Bevezetés (1) Számításiteljesítménymegadása Abszolútteljesítmény Relatívteljesítmény Eredményesen végrehajtott utasítások száma/sec Egy adott alkalmazási területen jellemzi a teljesítményt Egy benchmark programcsomagvalamelyreferenciarendszerenés a vizsgáltrendszerenmértfutásiidőinekösszevetéseazalábbiértelmezéssel (mértaniközép): Eredményesenvégrehajtottműveletekszáma/sec (SIMD) fc: Órafrekvencia IPC: Utasítások száma/ciklus OPI: Műveletek száma/utasítás Pl: SPECint92, SPECint_base2000 Pl:MIPS, GIPS, MFLOPS, GFLOPS, TFLOPS (Paalkalmazásfüggő, max. teljesítményjellemzésére)

  4. 1.1. Bevezetés (2) Példa SPECint eredményekre: 1.1. ábra: Programcsomag egyes programjainak futásidő arányai Forrás: http://www.spec.org

  5. 1.1. Bevezetés (3) Processzorok abszolút teljesítménye az utasításokra vonatkoztatva: az eredményesen végrehajtott utasítások száma/sec ahol: fc : órafrekvencia IPCeff : az óraciklusonként eredményesen végrehajtott utasítások száma

  6. 1.1. Bevezetés (4) Processzorok hatékonysága (H): az óraciklusonként eredményesen végrehajtott utasítások száma azaz H = IPCeff így P = fc * H

  7. 1.1. Bevezetés (5) Grafikai teljesítmény megadása pl. játékok futtatásakor http://www.hardwarecanucks.com/forum/hardware-canucks-reviews/53054-intel-i7-3770k-ivy-bridge-cpu-review-17.html

  8. 1.2. A processzor teljesítmények növekedése (1) 1.2. ábra: Az x86 alapú egymagos Intel processzorok FX-teljesítményének növekedése

  9. 1.2. A processzor teljesítmények növekedése (2) 3. 1.4. ábra: A fixpontos teljesítmények növekedése (általában - 2) Forrás: F. Labonte, www-vlsi.stanford.edu/group/chart/specInf2000.pdf

  10. 2. A processzorok hatékonysága 2.1. Bevezetés ?

  11. 2.2. A processzorok hatékonyságának növekedése (1) 2.1. ábra: Intel processzorok hatékonysága

  12. 2.2. A processzorok hatékonyságának növekedése (2) 2.2. ábra: Processzorok teljesítményének/hatékonyságának növekedése (általában) Forrás:J. Birnbaum, „Architecture at HP: Two decades of Innovation”, Microprocessor Forum, October 14, 1997.

  13. 2.3. A hatékonyság növelés hozzájárulása a teljesítmények növeléséhez (2. generációig) ? A második generációig az órafrekvencia és a hatékonyság növelése egyenlő arányban járultak hozzá a teljesítmény növeléséhez.

  14. 2.4. A hatékonyság növekedése és annak korlátja 2.4. ábra: Processzorok hatékonyságának növekedése a 2. gen. szuperskalárokig

  15. 2.5. A hatékonyság növelésénekfőbb forrásai (1) Általános célú feldolgozást tekintve Szóhossz növelése Feldolgozási szélesség növelése

  16. 2.5. A hatékonyság növelésénekfőbb forrásai (2) Szóhossz növelése 8 bit (8008)  16 bit (286) 32 bit (386DX)  64 bit adatszélesség (Pentium)  64 bit (Pentium 4 EMT)

  17. 2.5. A hatékonyság növelésénekfőbb forrásai (3) Feldolgozási szélesség növelése Időbeli párhuzamosság bevezetése, növelése 1. és 2. generációs futószalag processzorok (386DX, 486DX) 1 Kibocsátási párhuzamosság bevezetése, növelése 1. és 2. generációs szuperskalárok (Pentium, Pentium Pro) 2. Gen. 1. Gen. 4 2

  18. 4 2 1 2.5. A hatékonyság növelésénekfőbb forrásai (4) A feldolgozási szélesség növelése (összefoglalás) pipeline superscalar 1. Gen. 2. Gen.

  19. 2.5. A hatékonyság növelésénekfőbb forrásai (5) 2. gen. szuperskalár • gen. szuperskalár Stagnálás Futószalag ~10x/10 év 2.5. ábra: Processzorok hatékonyságának növekedése a 2. gen szuperskalárokig

  20. 2.5. A hatékonyság növelésének első korlátja (1) 2. generációsszuperskalárok(széles szuperskalárok) Feldolgozási szélesség 4 RISC utasítás/ciklus ~3 CISC utasítás/ciklus Forrás: Wall: Limits of ILP, WRL TN-15, Dec. 1990 2.3. ábra: A feldolgozás szélessége és az általános célú alkalmazásokban rejlő párhuzamosság mértéke a 2. generációs (széles) szuperskalárokban

  21. 2.5. A hatékonyság növelésének korlátja (2) Általános célú alkalmazásokban: 2. generációs szuperskalárok szélessége már megközelíti rendelkezésre álló ILP mértékét Általános célú alkalmazásokban a 2. generációs (széles) szuperskalárokkal kezdődően a hatékonyság növelésének lehetőségea feldolgozási szélesség nővelésével kimerült

  22. 3. A processzor hatékonyság stagnálása által kiváltott fejlődési főirányok áttekintése EPIC architektúrák kifejlesztése Az órafrekvencia erőteljes növelése (4. – 7. pontok) (8. pont) A fejlődés fővonala

  23. 4. Az órafrekvencia erőteljes növelése 4.1. Az órafrekvencia növelésének forrásai (1) Az órafrekvencia növelése A futószalag fokozatok logikai hosszának csökkentése A gyártási technológia vonalvastagságának csökkentése

  24. 4.1. Az órafrekvencia növelésének forrásai (2) 4.1. ábra: Az Intel gyártási technológiák fejlődése Forrás: D. Bhandarkar: „The Dawn of a New Era”, 11. EMEA, May, 2006.

  25. Órajel Órajel n x FO4 4.1. Az órafrekvencia növelésének forrásai (3/1) Egy futószalag fokozat logikai hossza (n x FO4) FO4: Fan-out of Four A “leghosszabb”futószalag fokozat logikai hosszahatározza meg a max. órafrekvenciát (a jelnek át kell érnie!). Órajel

  26. 4.1. Az órafrekvencia növelésének forrásai (3/2) A futószalag logikai hosszának csőkkentése a futószalag fokozatok számának növelésével: F W D E D1 D2 E1 E2 W1 W2 F2 F1

  27. 4.1. Az órafrekvencia növelésének forrásai (4) 4.3. ábra: Futószalag fokozatok logikai hossza processzorokban (FO4) Forrás: F. Labonte www-vlsi.stanford.edu/group/chart/CycleFO4.pdf

  28. P4 Prescott (~30) Pentium 4 (~20) Athlon-64 (12) Athlon K6 (6) (6) 4.1. Az órafrekvencia növelésének forrásai (5) No of pipeline stages 40 30 * Core Duo 20 * Conroe Pentium Pro (14) (~12) * Pentium * * 10 (5) * * * Year 1995 2005 2000 1990 4.2 ábra: A futószalag fokozatok száma Intel és AMDprocesszorokban

  29. 4.2. Az órafrekvenciák növekedési üteme (1) 4.4. ábra: Az x86 alapú Intel processzorok órafrekvenciájának növekedése

  30. 4.2. Az órafrekvenciák növekedési üteme (2) 4.5. ábra: Az órafrekvenciák növekedési üteme (általában)

  31. 4.3. Az órafrekvencia erőteljes növelésének konzekvenciái 4.3.1. Áttekintés RISC processzorok kiszorulása (4.3.2) Fejlődési korlátok megjelenése (4.3.3)

  32. 4.3.2. RISC processzorok kiszorulása (1) 4.6. ábra: RISC processzorok kiszorulása

  33. A legtöbb RISC processzorcsalád fejlesztésének leállítása, mint pl. MIPS R családja, HP Alpha és PA családjai, illetve a PowerPC Consortium PowerPC családja 4.3.2. RISC processzorok kiszorulása (2) 1995-2000: A CISC processzorok átvették a vezetést a teljesítmény versenyben, mivel magasabb órafrekvenciáról indulva (RISC) nem volt tartható az azonos iramú frekvencia növelés, mint alacsonyabb frekvencia értékről (CISC) 1997: Intel és HP bejelentették az IA-64/Merced architektúrát/processzorcsaládot, mint a 32-bites x86 architektúrát leváltó új generációt

  34. 4.3.3. Fejlődési korlátok megjelenése (1) Hatékonysági korlát (5. pont) Disszipációs korlát (6. pont) Párhuzamos buszok frekvenciakorlátja (7. pont)

  35. 4.3.3. Fejlődési korlátok megjelenése (2) Órafrekvenciák stagnálása Hatékonysági korlát (5. pont) Disszipáció csökkentés előtérbe kerülése Disszipációs korlát (6. pont) Soros buszok megjelenése Párhuzamos buszok frekvenciakorlátja (7. pont)

  36. 5. A második hatékonysági korlát 5.1. Áttekintés Alapvető ok: A processzor és a memória közötti sebességolló (növekvő órafrekvenciákon tágul)

  37. 5.1. Áttekintés (2) A sebességolló konkrét megnyilvánulásai: DRAM késleltetési ideje Memória átviteli rátája Cache tárak elérési ideje A processzor busz átviteli rátája

  38. 5.1 Áttelomtás (3) DRAMs for general use DRAMs with parallel bus connection DRAMs with serial bus connection Commodity DRAMs Synchronous DRAMs Asynchronous DRAMs FP (~1974) XDR (2006)1 DRDRAM (1999) DRAM (1970) SDRAM (1996) DDR (2000) DDR2 (2004) DDR3 (2007) FBDIMM (2006) FPM (1983) EDO (1995) Year of intro. Challenging DRAM types Main stream DRAM types 1 Used in the Cell BE and the PlayStation 3, but not yet in desktops or servers Ábra: Legfontosabb DRAM típusok The scene of main memories

  39. 5.2. A processzor és a memória közötti sebességolló (2) Read latency1 (ns) 200 200 * 180 160 150 * 140 120 100 100 * 80 80 * * 70 80 60 * 60 * * 50 60 * * 40 50 * 40 30 * * 25 40 * * 35 * * 30 * 20 24 22 92 Year 81 82 83 87 88 89 1990 91 93 94 95 97 98 99 02 84 96 01 03 04 05 07 85 86 06 2000 Desktop P4 PII AT 386 DX 486 DX P PIII Pentium D PC processor Core2 Chipset 430FX 440ZX 965 430VX 915 420TX 8152 8202 850 845 8453 P35 430LX DRAM type FPM FPM DRAM FPM EDO FPM DDR3 DDR2 DDR DRAM DRAM DRAM DRAM FPM SDRAM DDR DDR2 DDR2 EDO FPM SDRAM EDO SDRAM RDRAM SDRAM RDRAM Typ. DRAM size (bits) 128 M 64 K 256 M 16 K 64 K 64 K 256 K 256 K 64 M 64 M 256 K 512 M 256 M 4 M 16 M 512 M 4 M 256 M 512 M 1 M 1 M 16 M 128 M 128 M 1 M 16 M 512 M 128 K 128 K 1 G 64 M 1 G 256 K 1 G 4 M 64 M 256 M 256 M 1 G 2 G 512 M 1 Read latency of DRAM, FPM, EDO and BEDO parts = tRAC (Row access time (time from row address until data valid)) Read latency of SDRAM parts = CL + tRCD (Cslumn delay + Row to Cloumn delay) 2 The 815 chipset support SDRAM while the 820 RDRAM 3 A new revision of the 845 supports DDR instead of SDRAM 5.1b ábra: DRAM chipek késleltetési ideje

  40. 5.2. A processzor és a memória közötti sebességolló (3) Memory latency ns 300 210 * 200 RDRAM 200 * 160 * 155 * 140 135 * 120 * 110 * * 85 100 * 70 * 50 Year 2000 02 92 01 03 04 05 07 08 81 82 83 87 88 89 1990 91 93 94 95 97 98 99 06 84 96 85 86 Desktop Pentium D 386 DX 486 DX P PPro Core2 PC AT PII PIII P4 processor (8088) (286) 430FX 440ZX 965 430VX 915 420TX 8152 8202 850 845 8453 P35 430LX Chipset FPM FPM DRAM type DRAM FPM EDO FPM DDR3 DDR2 DDR DRAM DRAM FPM SDRAM DDR DDR2 DDR2 EDO FPM SDRAM EDO SDRAM DRAM DRAM RDRAM SDRAM RDRAM Typ. DRAM parts (bits) 128 M 256 M 16 K 64 K 256 K 64 M 64 M 256 K 256 K 512 M 64 K 64 K 256 M 4 M 16 M 512 M 4 M 256 M 512 M 1 M 16 M 128 M 128 M 1 M 1 M 16 M 512 M 1 G 64 M 128 K 128 K 1 G 1 G 64 M 256 M 256 M 256 K 4 M 1 G 2 G 512 M 5.1c ábra: DRAM memóriák tipikus késleletetési ideje x86-os rendszerekben (ns)

  41. 5.2. A processzor és a memória közötti sebességolló (4) Memory latency in proc. cycles 1000 500 280 240 220 300 * * 180 * 200 RDRAM * 85 100 * 50 40 * 30 20 10 * 10 5 3 * 3 2 1 1 * * 1 Year 2000 01 02 03 04 05 81 82 83 87 88 89 1990 91 92 93 94 95 97 98 99 07 08 84 96 06 85 86 Pentium D Core2 386 DX 486 DX P PPro Desktop PC AT PII PIII P4 processor (8088) (286) 430FX 440ZX 965 430VX 915 420TX 8152 8202 850 845 8453 P35 430LX Chipset FPM FPM DRAM FPM EDO FPM DDR3 DDR2 DDR DRAM DRAM FPM SDRAM DDR DDR2 DDR2 EDO FPM SDRAM EDO SDRAM DRAM type DRAM DRAM RDRAM SDRAM RDRAM Typ. DRAM parts (bits) 128 M 256 M 16 K 64 K 256 K 64 M 64 M 256 K 256 K 512 M 64 K 64 K 256 M 4 M 16 M 512 M 4 M 256 M 512 M 1 M 16 M 128 M 128 M 1 M 1 M 16 M 512 M 1 G 64 M 128 K 128 K 1 G 1 G 64 M 256 M 256 M 256 K 4 M 1 G 2 G 512 M 5.1d ábra: DRAM memóriák tipikus késleletetési ideje x86-os rendszerekben (ciklusokban)

  42. 5.2. A processzor és a memória közötti sebességolló (5) 5.2. ábra: Memóriák relatív átviteli rátája (D: kétcsatornás)

  43. 5.2. A processzor és a memória közötti sebességolló (6) 5.4. ábra: A processzor busz (FSB) relatív átviteli rátája

  44. 5.2. A processzor és a memória közötti sebességolló (7) 5.3. ábra: Intel Pentium 4 L2 cache tárak elérési ideje

  45. 5.3. A 3. generációs szuperskalárok hatékonysága (1) FSB órafrekvencia Memoria átviteli rátája Háttértár típusa 5.5. ábra: Intel Pentium III és Pentium 4 processzorainak hatékonysága fixpontos feldolgozás esetén

  46. 5.3. A 3. generációs szuperskalárok hatékonysága (2) 5.6. ábra: AMD Athlon, Athlon XP és Athlon 64 processzorainak hatékonysága fixpontos feldolgozás esetén

  47. 5.3. A 3. generációs szuperskalárok hatékonysága (3) 5.7. ábra: A fejlett szuperskalárok hatékonyságát megszabó legfontosabb tényezők

  48. 5.3. A 3. generációs szuperskalárok hatékonysága (4) 5.8. ábra: Intel és AMD processzorok hatékonyságának összehasonlítása

  49. 5.3. A 3. generációs szuperskalárok hatékonysága (5) 5.9. ábra: Intel és AMD processzorok tervezési filozófiájának összehasonlítása

  50. 5.3. A 3. generációs szuperskalárok hatékonysága (6) A processzorok hatékonysági korlátjának konzekvenciája: Növekvő órafrekvenciákon egyre csökkenő teljesítménytöbblet Magasabb órafrekvencia Magasabb disszipáció Az órafrekvenciák stagnálása

More Related