1 / 21

第 11 章

第 11 章. 高档微处理器. 11.1 高能奔腾 — Pentium Pro. 1996 年后, Intel 又相继推出了 高能奔腾 —Pentium Pro 、 多能奔腾 —Pentium MMX 、 二代奔腾 —Pentium II 、 多能奔腾二代 —Pentium III 等 Pentium 系列高档微处理器. 1 . RISC 技术

zonta
Download Presentation

第 11 章

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第 11 章 高档微处理器

  2. 11.1 高能奔腾 — Pentium Pro 1996年后,Intel又相继推出了 高能奔腾—Pentium Pro、 多能奔腾—Pentium MMX、 二代奔腾—Pentium II、 多能奔腾二代 —Pentium III 等Pentium系列高档微处理器

  3. 1.RISC 技术 Intel 在开发Pentium Pro 微处理器高性能过程中也采用了RISC技术。Pentium Pro 微处理器不仅是一代卓越的超标量微处理器,而且是超流水线型的,在同样的时钟速率下比Pentium快三分之一。 2.Pentium Pro新技术 Intel的Pentium Pro 微处理器的“Dynamic Execution(动态执行)”使得Pentium Pro 微处理器在大多数情况下处理指令的效率比Pentium更高一些。 3.事务总线 Pentium Pro 微处理器采用的是事务总线设计,可以支持多个特殊的总线请求。 4.Pentium Pro内部结构 Pentium Pro 微处理器采用的是一种特殊的总线结构。二级Cache 被设计成与Pentium Pro 微处理器同处一个芯片内,同被封装在一起 5.Pentium Pro 流水线 Pentium Pro 微处理器使用是一种被划分为按序、乱序和退出这样三个操作部分的14级深的流水线,

  4. 11. 2 多能奔腾—Pentium MMX 1996年底推出的Pentium 微处理器系列的改进版本—Pentium MMX微处理器(多能奔腾),所采用的MMX技术是Intel 最新发明的一项多媒体增强指令技术。它的指令系统新增加了57条为丰富和加速PC机上多媒体和通信而设计的新指令,所以被称之为“多媒体扩展指令系统”。

  5. 1.MMX技术 Pentium MMX使用了一种叫做单指令流、多数据流(SIMD)的技术,该技术能够使CPU同时对二个、四个甚至八个数据元素进行计算,且不会降低操作速度。 2.体系结构的改进 Pentium MMX功能的增强会简化系统中其他子系统。Pentium MMX提高了处理机分担多媒体计算的能力,这将使图形加速、声频、视频的设计和实现变得简单,从而降低了整个系统的成本。 3.简单的乘—累加操作 (1)在Pentium MMX上的操作方法 (2)在经典Pentium上操作的方法

  6. 11. 3 二代奔腾—Pentium II 1997年5月,Intel 推出了与Pentium Pro同一个级别的微处理器Pentium II。 Pentium II 虽然采用了原有Pentium Pro相同的核心体系结构,但它加快了对段寄存器写操作的速度,还增加了MMX指令,从而加速了操作系统的执行速度。由于Pentium II又增加了可重命名的段寄存器,因此Pentium II有能力可以猜测地执行写操作。 在总线方面,Pentium II采用了双独立总线结构,即其中的一条总线被连接到了二级Cache,另一条总线主要是负责主存储器的信息传送操作。

  7. 1.体系结构的增强 Pentium II微处理器又新配备了八个64位的MMX寄存器,以加速多媒体任务的执行。并且配置了可重命名的段寄存器,用以加速操作系统的执行速度。 采用了MMX多媒体增强技术的Pentium II微处理器与多能Pentium MMX微处理器相比,体系结构又有新意,结合双独立总线结构,即其中一条总线连接到二级Cache,另一条总线主要负责与主存储器之间的信息传送。 2.Pentium II 流水线 超标量技术 被Intel巧妙地移植到CISC类的Pentium II微处理器上。 超标量组织的主要部件是 指令预取和译码部件、 调度发送和执行部件、 指令缓冲部件 恢复部件。 3. Pentium II 的Cache 将Pentium II 上的一级Cache的容量从16KB加倍到32 KB 4. 分支转移预测 Pentium II使用的是基于转移指令近期执行历史的动态转移预测策略。由一个分支转移目标缓冲存储器(BTB)负责控制着它的运行,BTB进行的是高速缓冲存储操作,其内保存着近期所遇到的有关转移指令的相关信息。

  8. 11. 4 多能奔腾二代 —Pentium III 1999年2月,推出了Pentium III芯片。它是为提高用户的互联网计算而设计的微处理器。 Pentium III芯片所带来的最重要的技术创新之一就是它新增加的71条被称之为互联网的指令和处理机的序列号。 1.SSE指令 PentiumⅢ新增添的71条互联网SSE指令,SSE指令集中包含有以下三类指令: 八条高速缓冲存储器控制指令; 50条单指令多数据浮点运算指令; 12条新的多媒体指令等;

  9. 2.Pentium III的微体系结构 PentiumⅢ是基于Intel的P6微体系结构,其中包括增加带宽的快速100 MHz系统总线、大小规模为512 KB的二级Cache和使微处理器效率更高的动态执行技术。 微处理器的核心逻辑有所扩展,增加了一个新的微处理器状态、一个新的数据类型,和能够进行并行浮点和整数操作的8个128位的寄存器。总线速度扩展到450 MHz、500 MHz。 (1) 二级Cache PentiumⅢ把全速256 KB的二级Cache集成进了其核心芯片之内, (2) 更高的后端总线传输带宽 PentiumⅢ的“高级传输高速缓冲存储器”除了运行主频与核心频率一样外,它与PentiumⅢ核心运算部件之间的数据通路也从原来的64位提高到现在的256位,仅数据通路的带宽就提高了4倍。

  10. 11. 5 Pentium 4 为Pentium 4设计了一种被称之为“ NetBurst”的新微体系结构,它可以更好地满足目前互联网用户的需求。Pentium 4在数据加密、视频压缩和对等网络等方面的性能都有较大幅度的提高。 1.Pentium 4 的 NetBurst 微体系结构 所谓NetBurst,顾名思义;Net—即网的意思;Burst—成组传输 、突发传输的意思。 若在网上传输数据,不传则已,传则即为很大的信息量。如传一幅图片,总不能让用户等半天才能得到信息。这样就要求Pentium 4 快速地、大量地处理信息和传送信息。

  11. 系统总线400MHz 高速执行 引擎 具先进传输机制的 2 级 Cache 超级流水线技术 高级动态执行机制 性能增强了的浮点部件和多媒体部件 拥有执行追踪功能的 1级 Cache 图中展示出了Pentium 4 微处理器内部结构及各功能部件在芯片内的位置

  12. 2. 超级流水线技术 Pentium 4配备了新的超级流水线技术,它把流水线的深度增加到20级,Pentium 4的超级流水线上配备有20个基本操作部件,所以Pentium 4的操作速度也就快得多。 衡量CPU性能的公式是: 性能 = CPU的主频 IPC 3.高速的系统总线(400 MHz) Pentium 4在数据传输方面采用了其时钟频率为400 MHz新的系统总线。 4.拥有执行追踪功能的一级 Cache Pentium 4的一级指令Cache 被改进成执行追踪的Cache,其容量12KB,但是由于在 Pentium 4的执行追踪的Cache内存放着已经译好码的微指令 ( μOPs ) ,使Pentium 4不必每次都要重新给指令译码,从而大大加快了译码速度,

  13. 5. 高级动态执行机制 Pentium 4配备的高级动态执行机制,使Pentium 4在流水线中所能处理的指令条数比Pentium III多出3倍以上,并能合理地预测分支转移指令。 6. 高速执行引擎 在Pentium 4中配置了一种时钟缓冲器电路,可以使NetBurst微体系结构下的算术运算和逻辑运算部件ALU能够在2倍于CPU主频的速度下操作,Intel把其称之为高速执行引擎。 7.配备有先进传输机制的二级Cache Pentium 4的NetBurst微体系结构使用的二级Cache其大小规模为256 KB,又称可进行高级传输的缓冲存储器

  14. 9.性能增强了的浮点部件和多媒体部件 Pentium 4 把浮点寄存器扩展成了128位,并且又增加了一个用于数据传送的 辅助寄存器,这样就大大改善了浮点部件和多媒体部件的性能。 10.单指令多数据扩展的数据流SIMD(SSE2)指令集 Pentium 4引进了为加速执行各种应用程序而设计的、包含144条多媒体及图形指令的单指令多数据扩展的数据流 SIMD (SSE2)指令集,其中SIMD是指单指令多数据操作,它们是第二代高级浮点以及多媒体指令集(SSE2)。

  15. 11. 6 64位技术 2005年4月,Intel推出了她的64位微处理器EM-64T,即存储器扩展64位微处理器技术。 存储器扩展64位微处理器技术具体表现在:新的操作模式,新增加和增强的指令多达432条。 存储器扩展64位微处理器技术,对传统模式、兼容模式、64位模式等这3种操作模式都给以支持:

  16. 1.传统模式 所谓传统模式,即在32位微处理器使用过的,而在64位微处理器上保留下来的操作模式。在存储器扩展64位微处理器上,像之前的32位操作系统、32位应用程序、32位驱动程序等都是传统模式,64位微处理器技术一如既往地都提供支持。 2.兼容模式 兼容模式是在代码段基础上的、经操作系统允许的一种操作模式。 在存储器扩展的64位微处理器上,不仅对新的64位操作系统、新的64位驱动程序提供支持,而且对以前的32位应用程序也照样提供支持 3.64位模式 64位的操作模式是在代码段基础上,由操作系统允许并启动的一种操作模式。 在存储器扩展64位微处理器上,对全新的64位操作系统、64位应用程序、64位驱动程序、64位虚拟地址空间给以支持,而且使用全新的64位通用寄存器GPRs。 当访问比64位寄存器和64位地址还大的信息时,使用64位的通用寄存器GPRs。

  17. 4. 通用寄存器 在存储器扩展64位微处理器上,把现有的32位的8个通用寄存器都展宽到64位,根据功能的需求又新增加了8个64位通用寄存器。 64位微处理器,还新设置了8个新的128位的、单指令多数据流SIMD 扩展寄存器 5. 不变的寄存器 64位微处理器, 它就保留了32位微处理器使用的那个32位的标志寄存器EFLAGS ,浮点部件上的那8个80位的浮点数值寄存器ST0~ST7,32位微处理器上使用的8个64位的多媒体寄存器MM0~MM7,也同样保留了下来。 6.分支转移技术 64位微处理器的扩展技术,把分支转移机制扩充成二个,以便满足64位线性地址空间中的分支转移需求。 (1)近程分支转移,在64位的操作模式中被重新定义。 (2)在64位的操作模式和兼容模式下,64位的调用门描述符用于远程调用。在64位的操作模式中,所有的近程分支转移的操作数规模大小,都被强制成64位的。

  18. 8.超线程技术 采用超线程技术HT技术的目的,是在多任务处理环境内,在执行多线程操作系统以及应用程序,或者单线程应用程序时,用来改善32位微处理器的性能。 这项技术可以使一个微处理器同时运行两个或多个各自独立的程序。 9.高级动态执行机制 64位微处理器上采用的高级动态执行技术包括: (1)较深的流水线技术、乱序执行技术、再加上推测执行引擎: ① 可以让126条指令鱼贯执行。 ② 在流水线内可以执行 48个装入操作、以及 24个存储操作。 (2)增强了的分支转移预测能力 ① 与较深的流水线技术结合在一起,有效地减少了由于不实 施预测而造成的损失。 ② 先进的分支转移预测算法 ③ 在分支转移目标阵列内容纳4K个目标项。

  19. 内核0 内核1 总线前端 11. 7 双核技术 11.7.1. 什么是双核处理器 什么是双核处理器?就是在同一个微处理器芯片内配置有两个功能一样的处理器核心,这样的微处理器芯片就称为双核处理器,如图所示,所采用的技术就双核技术。若是在同一个微处理器芯片内配置有多个功能一样的处理器核心,就是多核处理器。

  20. 11.7.2. 双核技术优势 采用多核处理器技术,可以使微处理器的性能更高,处理信息的能力更强,信息处理技术更先进,微处理器提供更强的性能,而不需要增加能耗或实际空间。 首先,采用双核技术是提高微处理器性能的行之有效的方法之一。增加一个内核,微处理器在每个时钟周期内执行的指令条数将增加一倍。 其次,在微处理器内引入双核结构,可以全面提升微处理器的功能

  21. 系统总线前端 核心执行部件 核心执行部件 Cache L2 2MB Cache L2 2MB 总线(前端输入) 总线(前端输入) 11.7.3. 双核微体系结构 图中展示出了双核处理器的体系结构,由图可以看出,在一个芯片内集成进两个核心执行部件,而每一个核心执行部件都配备有一个二级Cache L2,其容量为2MB。二级Cache与系统总线的前端相连。

More Related