210 likes | 422 Views
第 11 章. 高档微处理器. 11.1 高能奔腾 — Pentium Pro. 1996 年后, Intel 又相继推出了 高能奔腾 —Pentium Pro 、 多能奔腾 —Pentium MMX 、 二代奔腾 —Pentium II 、 多能奔腾二代 —Pentium III 等 Pentium 系列高档微处理器. 1 . RISC 技术
E N D
第 11 章 高档微处理器
11.1 高能奔腾 — Pentium Pro 1996年后,Intel又相继推出了 高能奔腾—Pentium Pro、 多能奔腾—Pentium MMX、 二代奔腾—Pentium II、 多能奔腾二代 —Pentium III 等Pentium系列高档微处理器
1.RISC 技术 Intel 在开发Pentium Pro 微处理器高性能过程中也采用了RISC技术。Pentium Pro 微处理器不仅是一代卓越的超标量微处理器,而且是超流水线型的,在同样的时钟速率下比Pentium快三分之一。 2.Pentium Pro新技术 Intel的Pentium Pro 微处理器的“Dynamic Execution(动态执行)”使得Pentium Pro 微处理器在大多数情况下处理指令的效率比Pentium更高一些。 3.事务总线 Pentium Pro 微处理器采用的是事务总线设计,可以支持多个特殊的总线请求。 4.Pentium Pro内部结构 Pentium Pro 微处理器采用的是一种特殊的总线结构。二级Cache 被设计成与Pentium Pro 微处理器同处一个芯片内,同被封装在一起 5.Pentium Pro 流水线 Pentium Pro 微处理器使用是一种被划分为按序、乱序和退出这样三个操作部分的14级深的流水线,
11. 2 多能奔腾—Pentium MMX 1996年底推出的Pentium 微处理器系列的改进版本—Pentium MMX微处理器(多能奔腾),所采用的MMX技术是Intel 最新发明的一项多媒体增强指令技术。它的指令系统新增加了57条为丰富和加速PC机上多媒体和通信而设计的新指令,所以被称之为“多媒体扩展指令系统”。
1.MMX技术 Pentium MMX使用了一种叫做单指令流、多数据流(SIMD)的技术,该技术能够使CPU同时对二个、四个甚至八个数据元素进行计算,且不会降低操作速度。 2.体系结构的改进 Pentium MMX功能的增强会简化系统中其他子系统。Pentium MMX提高了处理机分担多媒体计算的能力,这将使图形加速、声频、视频的设计和实现变得简单,从而降低了整个系统的成本。 3.简单的乘—累加操作 (1)在Pentium MMX上的操作方法 (2)在经典Pentium上操作的方法
11. 3 二代奔腾—Pentium II 1997年5月,Intel 推出了与Pentium Pro同一个级别的微处理器Pentium II。 Pentium II 虽然采用了原有Pentium Pro相同的核心体系结构,但它加快了对段寄存器写操作的速度,还增加了MMX指令,从而加速了操作系统的执行速度。由于Pentium II又增加了可重命名的段寄存器,因此Pentium II有能力可以猜测地执行写操作。 在总线方面,Pentium II采用了双独立总线结构,即其中的一条总线被连接到了二级Cache,另一条总线主要是负责主存储器的信息传送操作。
1.体系结构的增强 Pentium II微处理器又新配备了八个64位的MMX寄存器,以加速多媒体任务的执行。并且配置了可重命名的段寄存器,用以加速操作系统的执行速度。 采用了MMX多媒体增强技术的Pentium II微处理器与多能Pentium MMX微处理器相比,体系结构又有新意,结合双独立总线结构,即其中一条总线连接到二级Cache,另一条总线主要负责与主存储器之间的信息传送。 2.Pentium II 流水线 超标量技术 被Intel巧妙地移植到CISC类的Pentium II微处理器上。 超标量组织的主要部件是 指令预取和译码部件、 调度发送和执行部件、 指令缓冲部件 恢复部件。 3. Pentium II 的Cache 将Pentium II 上的一级Cache的容量从16KB加倍到32 KB 4. 分支转移预测 Pentium II使用的是基于转移指令近期执行历史的动态转移预测策略。由一个分支转移目标缓冲存储器(BTB)负责控制着它的运行,BTB进行的是高速缓冲存储操作,其内保存着近期所遇到的有关转移指令的相关信息。
11. 4 多能奔腾二代 —Pentium III 1999年2月,推出了Pentium III芯片。它是为提高用户的互联网计算而设计的微处理器。 Pentium III芯片所带来的最重要的技术创新之一就是它新增加的71条被称之为互联网的指令和处理机的序列号。 1.SSE指令 PentiumⅢ新增添的71条互联网SSE指令,SSE指令集中包含有以下三类指令: 八条高速缓冲存储器控制指令; 50条单指令多数据浮点运算指令; 12条新的多媒体指令等;
2.Pentium III的微体系结构 PentiumⅢ是基于Intel的P6微体系结构,其中包括增加带宽的快速100 MHz系统总线、大小规模为512 KB的二级Cache和使微处理器效率更高的动态执行技术。 微处理器的核心逻辑有所扩展,增加了一个新的微处理器状态、一个新的数据类型,和能够进行并行浮点和整数操作的8个128位的寄存器。总线速度扩展到450 MHz、500 MHz。 (1) 二级Cache PentiumⅢ把全速256 KB的二级Cache集成进了其核心芯片之内, (2) 更高的后端总线传输带宽 PentiumⅢ的“高级传输高速缓冲存储器”除了运行主频与核心频率一样外,它与PentiumⅢ核心运算部件之间的数据通路也从原来的64位提高到现在的256位,仅数据通路的带宽就提高了4倍。
11. 5 Pentium 4 为Pentium 4设计了一种被称之为“ NetBurst”的新微体系结构,它可以更好地满足目前互联网用户的需求。Pentium 4在数据加密、视频压缩和对等网络等方面的性能都有较大幅度的提高。 1.Pentium 4 的 NetBurst 微体系结构 所谓NetBurst,顾名思义;Net—即网的意思;Burst—成组传输 、突发传输的意思。 若在网上传输数据,不传则已,传则即为很大的信息量。如传一幅图片,总不能让用户等半天才能得到信息。这样就要求Pentium 4 快速地、大量地处理信息和传送信息。
系统总线400MHz 高速执行 引擎 具先进传输机制的 2 级 Cache 超级流水线技术 高级动态执行机制 性能增强了的浮点部件和多媒体部件 拥有执行追踪功能的 1级 Cache 图中展示出了Pentium 4 微处理器内部结构及各功能部件在芯片内的位置
2. 超级流水线技术 Pentium 4配备了新的超级流水线技术,它把流水线的深度增加到20级,Pentium 4的超级流水线上配备有20个基本操作部件,所以Pentium 4的操作速度也就快得多。 衡量CPU性能的公式是: 性能 = CPU的主频 IPC 3.高速的系统总线(400 MHz) Pentium 4在数据传输方面采用了其时钟频率为400 MHz新的系统总线。 4.拥有执行追踪功能的一级 Cache Pentium 4的一级指令Cache 被改进成执行追踪的Cache,其容量12KB,但是由于在 Pentium 4的执行追踪的Cache内存放着已经译好码的微指令 ( μOPs ) ,使Pentium 4不必每次都要重新给指令译码,从而大大加快了译码速度,
5. 高级动态执行机制 Pentium 4配备的高级动态执行机制,使Pentium 4在流水线中所能处理的指令条数比Pentium III多出3倍以上,并能合理地预测分支转移指令。 6. 高速执行引擎 在Pentium 4中配置了一种时钟缓冲器电路,可以使NetBurst微体系结构下的算术运算和逻辑运算部件ALU能够在2倍于CPU主频的速度下操作,Intel把其称之为高速执行引擎。 7.配备有先进传输机制的二级Cache Pentium 4的NetBurst微体系结构使用的二级Cache其大小规模为256 KB,又称可进行高级传输的缓冲存储器
9.性能增强了的浮点部件和多媒体部件 Pentium 4 把浮点寄存器扩展成了128位,并且又增加了一个用于数据传送的 辅助寄存器,这样就大大改善了浮点部件和多媒体部件的性能。 10.单指令多数据扩展的数据流SIMD(SSE2)指令集 Pentium 4引进了为加速执行各种应用程序而设计的、包含144条多媒体及图形指令的单指令多数据扩展的数据流 SIMD (SSE2)指令集,其中SIMD是指单指令多数据操作,它们是第二代高级浮点以及多媒体指令集(SSE2)。
11. 6 64位技术 2005年4月,Intel推出了她的64位微处理器EM-64T,即存储器扩展64位微处理器技术。 存储器扩展64位微处理器技术具体表现在:新的操作模式,新增加和增强的指令多达432条。 存储器扩展64位微处理器技术,对传统模式、兼容模式、64位模式等这3种操作模式都给以支持:
1.传统模式 所谓传统模式,即在32位微处理器使用过的,而在64位微处理器上保留下来的操作模式。在存储器扩展64位微处理器上,像之前的32位操作系统、32位应用程序、32位驱动程序等都是传统模式,64位微处理器技术一如既往地都提供支持。 2.兼容模式 兼容模式是在代码段基础上的、经操作系统允许的一种操作模式。 在存储器扩展的64位微处理器上,不仅对新的64位操作系统、新的64位驱动程序提供支持,而且对以前的32位应用程序也照样提供支持 3.64位模式 64位的操作模式是在代码段基础上,由操作系统允许并启动的一种操作模式。 在存储器扩展64位微处理器上,对全新的64位操作系统、64位应用程序、64位驱动程序、64位虚拟地址空间给以支持,而且使用全新的64位通用寄存器GPRs。 当访问比64位寄存器和64位地址还大的信息时,使用64位的通用寄存器GPRs。
4. 通用寄存器 在存储器扩展64位微处理器上,把现有的32位的8个通用寄存器都展宽到64位,根据功能的需求又新增加了8个64位通用寄存器。 64位微处理器,还新设置了8个新的128位的、单指令多数据流SIMD 扩展寄存器 5. 不变的寄存器 64位微处理器, 它就保留了32位微处理器使用的那个32位的标志寄存器EFLAGS ,浮点部件上的那8个80位的浮点数值寄存器ST0~ST7,32位微处理器上使用的8个64位的多媒体寄存器MM0~MM7,也同样保留了下来。 6.分支转移技术 64位微处理器的扩展技术,把分支转移机制扩充成二个,以便满足64位线性地址空间中的分支转移需求。 (1)近程分支转移,在64位的操作模式中被重新定义。 (2)在64位的操作模式和兼容模式下,64位的调用门描述符用于远程调用。在64位的操作模式中,所有的近程分支转移的操作数规模大小,都被强制成64位的。
8.超线程技术 采用超线程技术HT技术的目的,是在多任务处理环境内,在执行多线程操作系统以及应用程序,或者单线程应用程序时,用来改善32位微处理器的性能。 这项技术可以使一个微处理器同时运行两个或多个各自独立的程序。 9.高级动态执行机制 64位微处理器上采用的高级动态执行技术包括: (1)较深的流水线技术、乱序执行技术、再加上推测执行引擎: ① 可以让126条指令鱼贯执行。 ② 在流水线内可以执行 48个装入操作、以及 24个存储操作。 (2)增强了的分支转移预测能力 ① 与较深的流水线技术结合在一起,有效地减少了由于不实 施预测而造成的损失。 ② 先进的分支转移预测算法 ③ 在分支转移目标阵列内容纳4K个目标项。
内核0 内核1 总线前端 11. 7 双核技术 11.7.1. 什么是双核处理器 什么是双核处理器?就是在同一个微处理器芯片内配置有两个功能一样的处理器核心,这样的微处理器芯片就称为双核处理器,如图所示,所采用的技术就双核技术。若是在同一个微处理器芯片内配置有多个功能一样的处理器核心,就是多核处理器。
11.7.2. 双核技术优势 采用多核处理器技术,可以使微处理器的性能更高,处理信息的能力更强,信息处理技术更先进,微处理器提供更强的性能,而不需要增加能耗或实际空间。 首先,采用双核技术是提高微处理器性能的行之有效的方法之一。增加一个内核,微处理器在每个时钟周期内执行的指令条数将增加一倍。 其次,在微处理器内引入双核结构,可以全面提升微处理器的功能
系统总线前端 核心执行部件 核心执行部件 Cache L2 2MB Cache L2 2MB 总线(前端输入) 总线(前端输入) 11.7.3. 双核微体系结构 图中展示出了双核处理器的体系结构,由图可以看出,在一个芯片内集成进两个核心执行部件,而每一个核心执行部件都配备有一个二级Cache L2,其容量为2MB。二级Cache与系统总线的前端相连。