1 / 72

計算機組織與結構 - 效能設計

計算機組織與結構 - 效能設計. 第二章 電腦進化與效能表現. 2.1 電腦簡史. ENIAC – 全世界第一台電子計算機 Electronic Numerical Integrator And Computer 的簡寫 ( 電子數值積分器和計算機 ) 計畫主持人: Eckert 約克特 、 Mauchly 摩查理 計畫單位 :賓州大學 計畫目的 :計算新火砲的彈道 計畫 時間 : 1943 - 1946 可惜未趕上第二次世界大戰 運轉到 1955 年,宣告死訊,走入歷史. ENIAC 技術細節. 十進位 ( 非二進位 )

cora-vinson
Download Presentation

計算機組織與結構 - 效能設計

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 計算機組織與結構-效能設計 第二章電腦進化與效能表現

  2. 2.1電腦簡史 • ENIAC – 全世界第一台電子計算機 • Electronic Numerical Integrator And Computer的簡寫(電子數值積分器和計算機 ) • 計畫主持人:Eckert約克特、 Mauchly摩查理 • 計畫單位 :賓州大學 • 計畫目的 :計算新火砲的彈道 • 計畫時間 :1943-1946 • 可惜未趕上第二次世界大戰 • 運轉到1955年,宣告死訊,走入歷史

  3. ENIAC技術細節 • 十進位(非二進位) • 20個累積器(accumulator)(具有十個位數的儲存功能) • 程式依靠人工設定開關、插拔電纜線 • 18,000 真空管 • 30 噸 • 15,000平方英呎 • 消耗140 KW以上的電力 • 每秒5,000 個加法運算能力 • 即5,000 IPS(instructions per second)

  4. Von Neumann Machine范紐曼機器 • 第一個提出程式儲存觀念 • 主記憶體儲存程式和資料 • 使用二進位執行ALU運算 • 控制單元擷取記憶體的指令,並執行之 • 輸入/輸出裝置受控於控制單元 • 1952年,於普林司頓完成IAS電腦的建構 • 幾乎同時,Alan Turing也在發展這種觀念

  5. 范紐曼電腦架構內容 • IAS電腦架構內容: • 同時儲存資料和指令的主記憶體(M) • 二進位資料處理的算數邏輯單元(CA) • 直譯(interpret)並執行記憶體指令的程式控制單元(CC) • 受控制單元操作的輸入/輸出設備(I/O)內容

  6. 范紐曼電腦結構

  7. IAS細節 • 1000 x 40 bit 字組(word) • 二進位數字 • 2 x 20 bit 指令 • 暫存器(register, CPU內部的記憶體) • MBR( Memory Buffer Register,記憶體緩衝暫存器) • MAR( Memory Address Register,記憶體位址暫存器) • IR (Instruction Register,指令暫存器) • IBR ( Instruction Buffer Register,指令緩衝暫存器) • PC (Program Counter,程式計數器) • AC (Accumulator,累積器) • MQ (multiplier Quotient,乘法商數)

  8. IAS結構圖

  9. 電腦世代 • 真空管(1946-1957), 電晶體(1958-1964) • SSI小型積體電路(1965 開始) • 晶片內可容納100個元件 • MSI中型積體電路(到 1971) • 晶片內可容納100-3,000個元件 • LSI大型積體電路(1971-1977) • 晶片內可容納3,000 - 100,000 個元件 • VLSI超大型積體電路(1978 至今) • 晶片內可容納100,000 - 100,000,000 個元件 • ULSI極大型積體電路 • 晶片內可容納超過100,000,000 個元件

  10. 商業電腦:Eckert-Mauchly電腦公司 • 1947年 • 完成UNIVAC I電腦的建構 • 1950年 • 接受戶政局委託,執行人口普查 • 被購併成Sperry-Rand公司的UNIVAC部門 • 1950年代後期 • 完成UNIVAC II電腦的建構 • 速度更快 • 記憶體更多

  11. 商業電腦: IBM電腦公司 • 打孔卡片的主要製造商 • 1953 - IBM 701 • IBM第一台電子程式儲存電腦 • 科學應用 • 1955 - IBM 702 • 商業應用 • 這兩款機型是700/7000系列的前鋒

  12. 電晶體 • 1947年,貝爾實驗室的 William Shockley研製出第一顆電晶體 • 取代真空管 • 體積更小 • 成本更低 • 發熱更少 • 矽製材料(來源同於砂) • 固態裝置矽

  13. 電晶體電腦 • 電晶體開啟了第二代電腦革命 • NCR & RCA 製造小型電晶體電腦 • IBM 7000系列 • DEC 於1957年成立,當年立即發表 PDP-1

  14. 微電子學 • “微小的電子學” • 電腦可以看成是由閘、記憶細胞、和互連機制所構成的系統 • 可製作在矽半導體材料上,比如:矽晶圓(wafer) • 常稱為積體電路、IC、晶片

  15. 摩爾定律 • Intel創辦人 Gordon Moore所發表的定律 • 預測:晶片內元件密度的成長趨勢 • 從1965年後(至1970年) • 單一晶片內電晶體數目每年成長2倍 • 從1970年後(因成長趨緩,稍作修正) • 單一晶片內電晶體數目每18月成長2倍 (即,每 3年成長4倍)

  16. 摩爾定律的預估 • 晶片的成本不變 • 元件的尺寸縮小 • 空間的彈性增加 • 可降低電力消耗 • 可降低冷卻需求 • 更高的晶片密度意指更短的電氣路徑 • 更高的效能表現 • 減少互連增加可信度

  17. CPU內的電晶體數目成長圖

  18. IBM 360 系列 • 1964 • 取代7000 機型(但不相容) • 第一台有計畫製造的電腦家族 • 類似或相同的指令集 • 類似或相同的O/S • 速度增加 • I/O埠增加(即更多的端子) • 記憶體增大 • 成本增加 • 多工開關結構

  19. DEC PDP- 8 • 1964 • 第一台迷你電腦(在迷你裙之後) • 不必專用的空調室 • 小到足以放在工作平台上 • $16,000 (cf.當時IBM 360約需$100K) • 嵌入式應用& OEM • 匯流排結構

  20. 主記 憶體 I/O 模組 I/O 模組 操作台 控制器 CPU 公用匯流排 DEC PDP-8 匯流排結構

  21. 半導體(Semiconductor)記憶體 • 1970 • Fairchild公司 • 單一磁蕊的大小(即一位元磁蕊) • 容納256 位元 • 非破壞性讀取 • 速度更快於磁蕊 • 容量約每年成長二倍

  22. (提昇速度之)效能設計 • 管線技術 • 單板快取記憶體 • 單板 L1 & L2 快取記憶體 • 分支預測 • 資料流程分析 • 推估執行

  23. 效能無法匹配問題 • 處理器速度增加 • 記憶體容量增加 • 記憶體速度 遠落後於 處理器速度

  24. 邏輯電路和記憶體的效能差異

  25. 效能均衡技術 • 增加一次存取的位元數 • 拓”寬”DRAM ,而非加”深”DRAM • 改變DRAM介面 • 快取記憶體 • 降低記憶體存取頻率 • 更複雜的晶片內建快取記憶體 • 增加互連頻寬 • 高速匯流排 • 匯流排階層

  26. 發展週邊I/O • 如何快速地轉移處理器和週邊裝置之間的資料溝通,依舊是個難題 • 引進快取記憶體和緩衝架構,再加上運用更高速、更精細的的互連匯流排架構 • 使用多重處理器對於I/O需求方面,也可以提供幫助。

  27. 典型I/O設備之資料傳輸率

  28. 效能改善I -增快處理器速度 • 增快處理器硬體的速度 • 最簡單的作法就是微縮 晶片內部的邏輯閘尺寸,不但可置放更多的邏輯閘,而且訊號在邏輯閘內部的傳輸時間會明顯降低,因而提升處理器的速度增益。 • 增加快取記憶體的速度與容量 • 只要處理器晶片內部 讓出部份空間給快取,整體存取時間(access time)將會明顯地降低。 • 改善處理器組織和結構 • 將平行策略加入處理器組織和結構,建立更有效率的指令執行效能。

  29. 加快時脈速度產生的技術屏障 • 電力問題(Power) • 高密度和高速度所伴隨的散熱困難,成為嚴重的設計議題。 • RC延遲(RC Delay) • 晶片內部元件微縮尺寸後,變得更細的導線會增加阻抗;同樣地導線更接近彼此,也導致電容變大。一旦RC乘積增加時,延遲也跟著增加。 • 記憶體延遲(Memory Latency) • 記憶體延遲會拖慢處理器速度。

  30. Intel微處理器效能

  31. 效能改善II-晶片內建快取 • 在處理器和主記憶體之間加入快取結構,並且增大其記憶容量,目前現代電腦通常會置放2~3階快取記憶體架構。 • 當處理器晶片密度增大時,晶片內部可以提供更多的空間給快取記憶體,把快取記憶體直接積入(incorporate)處理器晶片內部,更可以大幅減少傳導路徑長度,有效地提升快取(fast access)效果。 • 比如:Pentium晶片大約空出10%內部空間,給快取記憶體使用;Pentium 4則有50%內部空間,提供給快取記憶體使用。

  32. 效能改善III-指令平行策略 • 有兩個值得注意的指令平行策略技術就是:管線技術(pipelining)和超純量技術(superscalar)。 • 所謂的管線技術有如工廠的生產線般,讓多個指令沿著管線通道前進,並且設法把通道分成不同階段(stage),在各個不同的階段上,同時執行多個指令。 • 至於,超純量技術則是在晶片內部複製多重管線通道,讓不相依的指令分配到不同的管線通道上,同時執行多個指令。

  33. 單一處理器的瓶頸 • 單純地依賴時脈速度的增快,將會出現功率消耗問題,更高的時脈速率產生更大量的熱功率,衍生出某些物理限制。 • 設計者在解決這種困難時,常轉向到其它基本技術,比如:在同一晶片內部,置放所謂的多核心(multicore)處理器,讓多重處理器共用大量的快取記憶體,開發潛藏效能,不必一直依賴時脈速率的改善。

  34. 多核心處理器的出現 • 研究指出,在同一處理器內部所增加的效能,大約正比於複雜度(complexity)的平方根[BORK03]; • 然而,如果倍增處理器數量,在軟體可支援多重處理器的情況下,則幾乎可以倍增效能。 • 由此可見,實現策略傾向使用多個處理器,而非更複雜地開發單一處理器的效能。

  35. Intel x86結構的進化 • 1971年發表4004 • 第一台微處理機 • CPU內所有的元件都在單一晶片上 • 4 位元 • 1972年發表8008 • 8 位元 • 特定用途的設計 • 1974 年發表8080 • Intel第一顆通用型微處理機

  36. x86 進化 • 8080 • 8 位元資料路徑 • 第一台通用型微處理器 • 組成第一台個人電腦Altair • 8086/88 • 更具威力 • 16 位元 • 指令快取, 預先擷取少量的指令 • 8088 (8 位元外部匯流排)用於首部IBM PC

  37. x86進化 • 80286 • 定址空間從1Mb提昇到16 MB記憶體 • 80386 • 32 位元 • 多工支援能力 • 80486 • 更複雜也更具威力的快取結構 • 指令管線技術 • 內建數學協同處理器

  38. Pentium 進化(1) • Pentium • 超純量(平行執行的多重指令) • Pentium Pro • 超純量組織 • 暫存器更名技術 • 分支預測 • 資料流程分析 • 推估執行 • Pentium II • MMX技術 • 繪圖、視訊、音效處理

  39. Pentium 進化(2) • Pentium III • 3D繪圖浮點數指令 • Pentium 4 • 更進一步地加強浮點數和多媒體能力 • Core 2 Duo • 64 bit • 雙核心 • Core 2 Quad • 64 bit • 四核心

  40. 嵌入式系統和ARM • 另一種處理器的設計方向則為RISC(精簡指令)電腦。 • ARM不但廣泛地運用於嵌入式系統(embedded system),也是市場上功能最強大、設計最好的RISC系統之一。

  41. 嵌入式系統 • 結合電腦硬體和相關軟體,將其附加於機械設備或其他產品上,以執行某種特定的專屬功能。 • 大部分的案例中,嵌入式系統通常只是系統或產品的一小部分,比如:汽車的ABS(煞車反鎖死系統)。

  42. 嵌入式系統的應用市場

  43. 嵌入式系統常見的組織方塊

  44. 嵌入式元件不同於一般電腦 • 可能具有不同的界面,讓系統進行測量、操控、外部環境互動等行為。 • 人機界面可能像閃爍燈一樣簡易,也可能像即時視覺一樣複雜。 • 診斷埠可能用來診斷外部控制系統,而不僅僅只診斷電腦而已。 • FPGA/ASIC或某些非數位硬體可能用來增進效能或改善安全。 • 內嵌應用軟體通常具備某種特定的專屬功能。

  45. ARM公司 • ARM晶片是英格蘭劍橋ARM公司所開發的RISC微處理器,主要作為微控制器(microcontroller)用途。 • 可能是目前市場使用最多、運用範圍最廣泛的嵌入式處理器。 • ARM公司本身並不直接製造處理器,而是將所設計的微處理器和多核心架構授權給其它製造廠商,製成小尺寸、低功率的高速晶粒,內建於遊戲、電話、手持設備(比如:PDA)、…等消費性產品。 • 舉例而言,蘋果(Apple)公司知名的iPod和iPhone就是使用ARM處理器。

  46. ARM進化 • ARM原始技術追溯於英國Acorn電腦公司,發展的微電腦架構。Acorn第一個商業RISC處理器 - ARM(Acorn RISC Machine)。 • 1985年,發表ARM1。 • 1985年,Acorn發表ARM2。 • 1989年,改良版的ARM3問世。 • 為了提升實力,Acorn與VLSI、Apple合資組成ARM公司,並且把Acorn RISC Machine改名為Advanced RISC Machine,簡稱仍是ARM。

  47. 表2.8 ARM家族的進化史

  48. ARM處理器適合應用的系統 • 嵌入式即時系統:儲存系統、自動機台、電力火車、工業和網路應用。 • 應用軟體平台:ARM可以執行開放式作業系統,包含-Linux、Palm OS、Symbian OS、Windows CE,並可當作無線通訊、消費娛樂和數位影像處理等應用平台。 • 保安應用:智慧卡、SIM卡和付費終端設備。

  49. 效能評估 • 時脈速度和IPS • 標準效能評估程式 • 阿姆達定律

  50. 系統時脈 • 處理器所執行的運算,比如:擷取指令、解碼指令、執行算術等,都由系統時脈控制動作程序。 • 運算啟使於時脈脈波,因而處理器速度是由脈波頻率所決定,時脈頻率的測量單位是Hz(Hertz)。

More Related