160 likes | 499 Views
C6000 指令集. 简介. C62XX 和 C67XX 共享一套指令集 C67XX 特定指令包括 32bit 整型乘法、双字读取和浮点操作. 指令和功能单元的映射. 操作码映射. 并行操作. 8 条指令构成一个取指包( FP ) P 位决定本条指令是否与其他指令并行 所有并行执行的指令组成一个执行包 执行包中的每条指令使用不同的功能单元 完全串行、完全并行、部分串行. 条件操作. 所有的 C6000 指令均为条件执行的,由每条指令的 4 个最高有效位控制,其中 3 位 creg 指定条件寄存器, 1 位 z 指定零测试或非零测试。
E N D
简介 • C62XX和C67XX共享一套指令集 • C67XX特定指令包括32bit整型乘法、双字读取和浮点操作
并行操作 • 8条指令构成一个取指包(FP) • P位决定本条指令是否与其他指令并行 • 所有并行执行的指令组成一个执行包 • 执行包中的每条指令使用不同的功能单元 • 完全串行、完全并行、部分串行
条件操作 • 所有的C6000指令均为条件执行的,由每条指令的4个最高有效位控制,其中3位creg指定条件寄存器,1位z指定零测试或非零测试。 • z=1进行零测试;z=0进行非零测试 • creg=0,z=0无条件执行
资源限制 • 同一执行包中,任两条指令不同使用相同的功能单元 • 同一指令周期,不能有两条指令对相同的寄存器执行写操作
使用相同功能单元的指令的限制 • 使用相同功能单元的两条指令不能安排在同一执行包中 ADD .S1 A0,A1,A2 || SHR .S1 A3,15,A4 ;S1被两条指令同时使用 ADD .L1 A0,A1,A2 || SHR .S1 A3,15,A4 ;使用两个不同的功能单元
使用交叉通路(1X和2X)的限制 • 使用同一条交叉通路的两条指令不能安排在同一个执行包中(只有1条交叉通路) ADD .L1X A0,B1,A1 || MPY .M1X A4,B4,A5 ;1X被两条指令同时使用 ADD .L1X A0,B1,A1 || MPY .M2X A4,B4,A5 ;使用了不同路径
数据读/写的限制(1) • 使用相同寄存器组作为目的地址/源地址的两条读/写指令不能安排在同一个执行包中。数据读写所用的地址寄存器必须与所用的功能单元处于同一数据通道 LDW .D1 *A0,A1 || LDW .D2 *A1,B2 ;.D2必须使用B组寄存器 LDW .D1 *A0,A1 || LDW .D2 *B0,B2 ; 寄存器所在组正确
数据读/写的限制(2) • 将数据读入到(或储存自)相同寄存器组的两条读(或写)指令、将数据读入到和储存自相同寄存器组的两条指令不能安排在同一执行包中 LDW .D1 *A4,A5 || STW .D2 A6,*B4 ;读入到、储存自同组寄存器 LDW .D1 *A4,B5 || STW .D2 A6,*B4 ; 寄存器所在组正确
使用长定点类型(40位)数据的限制(1) • 因为.S和.L单元共用一套为长定点型的源操作数准备的读寄存器通路和为长定点型的结果准备的写寄存器通路,所以每一个执行包只容许每一寄存器组处理一个长定点类型数据 ADD .L1 A5:A4,A1,A3:A2 || SHL .S1 A8,A9,A7:A6 ;两个长数据写入同一组 ADD .L1 A5:A4,A1,A3:A2 || SHL .S2 B8,B9,B7:B6 ;每组一个长数据
使用长定点类型(40位)数据的限制(2) • 因为.S和.L单元的一个长数据读通路和写通路共用,所以同一S单元或L单元的长数据读操作和存储操作不能安排在同一执行包中 ADD .L1 A5:A4,A1,A3:A2 || STW .D1 A8,*A9 ;长数据读操作与存储操作冲突 ADD .L1 A4,A1,A3:A2 || STW .D1 A8,*A9 ;去掉长数据读操作
存储器读取的限制 • 对同一寄存器在一个指令周期读取多于4次是不允许的,条件寄存器不在此限制之列 MPY .M1 A1,A1,A4 || ADD .L1 A1,A1,A5 || SUB .D1 A1,A2,A3 ;对A1进行5次读写 MPY .M1 A1,A1,A4 || ADD .L1 A0,A1,A5 || SUB .D1 A1,A2,A3 ;只对A1进行4次读写
存储器存储的限制 • 在同一指令周期内不能同时存在两条指令写入同一寄存器。具有同一目的地址的两条指令可以安排并行,只要向该目的寄存器的写操作不在同一指令周期发生 MPY .M1 A0,A1,A2 || ADD .L1 A4,A5,A2 ;写A2在同一周期发生! ADD .L1 A4,A5,A2 || MPY .M1 A0,A1,A2 ; 不存在问题!
C67XX指令的限制 • 某些指令功能单元等待时间大于1 • 考虑延迟间隙 • 还要考虑功能单元等待时间…