当前位置：和泉文库 > 计算机 > 浏览文档

《计算机体系结构》第四章指令级并行

第四章指令级并行 4.1指令级并行的概念 1.流水线的性能受限于流水线中指令之间的相关性: 结构相关数据相关(写后读RAW,读后写WAR,写后写WAW) 控制相关 CPI流水线=CPI理想+停顿结构相关+停顿写后读+停顿读后写 +停顿写后写+停顿控制相关本章研究的内容:如何消除这些停顿,使得进入流水线的指令序列运行时能有更好的并行性

文件格式：PPT，文件大小：765KB，售价：21.86元

文档详细内容（约83页）

篑第四章指令级并行 41指令级并行的概念 1.流水线的性能受限于流水线中指令之间的相关性结构相关数据相关(写后读RAW读后写WAR写后写狗 WAW) 控制相关 CP流水线=CP理想+停顿结构相关+停顿写后读+停顿读后写 +停顿写后写+停顿控制相关本章研究的内容:如何消除这些停顿使得进入流水

1. 流水线的性能受限于流水线中指令之间的相关性： • 结构相关 • 数据相关(写后读RAW,读后写WAR,写后写 WAW) • 控制相关 CPI流水线= CPI理想+停顿结构相关+停顿写后读+停顿读后写 +停顿写后写+停顿控制相关本章研究的内容:如何消除这些停顿,使得进入流水线的指令序列运行时能有更好的并行性第四章指令级并行 4.1 指令级并行的概念

篑 2.本章所研究的提高指令级并行的技术体()循环展开控制相关停顿条|(态海水词度数塌反 (4)分支预测:控制相关停顿狗 (5)推断所有数据/控制相关停顿 (6)多指令流出:提高理想cPI 其他技术:如向量计算机(不在本章讨论) 研究范围:一个基本程序块如一个循环体

2. 本章所研究的提高指令级并行的技术 (1)循环展开: 控制相关停顿 (2)基本流水线调度: 数据写后读停顿 (3)指令动态调度: 各种数据相关停顿 (4)分支预测: 控制相关停顿 (5)推断: 所有数据/控制相关停顿 (6)多指令流出: 提高理想CPI 其他技术: 如向量计算机(不在本章讨论) 研究范围: 一个基本程序块,如一个循环体

3.本章主要针对DLX浮点流水线来进行研究并作如下的假设: 体匚产生结果指令使用结果指令停顿周期数浮点计算另外的浮点计算3 浮点计算浮点存操作(SD)_2 浮点取操作①LD)浮点计算狗浮点取操作(LD)浮点存操作(SD)|0 而对DLX整型流水线除了分支指令有一个时钟周期延迟,其余指令没有延迟(为方便起见)

3. 本章主要针对DLX浮点流水线来进行研究,并作如下的假设: 产生结果指令使用结果指令停顿周期数浮点计算另外的浮点计算 3 浮点计算浮点存操作(SD) 2 浮点取操作(LD) 浮点计算 1 浮点取操作(LD) 浮点存操作(SD) 0 而对DLX整型流水线,除了分支指令有一个时钟周期延迟，其余指令没有延迟（为方便起见）

4.1.1循环展开调度的基本方法提高指令级并行的最基本方法 (1)指令调度 (2)循环展开一般由编译器来完成。指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加大到不小于指令执行延迟的时钟数,使相关指令成为实际上的无关指令

4.1.1 循环展开调度的基本方法提高指令级并行的最基本方法: (1)指令调度 (2)循环展开一般由编译器来完成。指令调度：通过改变指令在程序中的位置，将相关指令之间的距离加大到不小于指令执行延迟的时钟数，使相关指令成为实际上的无关指令

例:for(i=1;i<=1000;i++) x[]=x[+s; 考虑对应的DLX汇编语言实现约定:x[0]的内存地址为0(为简单起见) R1的初值为X[1000]的地址 F2中存放的值为常量s LOOP. LD FO,O(RI) ADDD F4 F0-F2 SD0(R1),F4 SUBI RI, R1#8 BNEZ RI LOOP

例： for (i=1; i<=1000; i++) x[i]=x[i] + s; 考虑对应的DLX汇编语言实现. 约定：x[0] 的内存地址为 0 （为简单起见） R1的初值为x[1000]的地址 F2中存放的值为常量 s LOOP: LD F0,0(R1) ADDD F4,F0,F2 SD 0(R1),F4 SUBI R1,R1,#8 BNEZ R1,LOOP

点击进入文档下载页（PPT格式）

共83页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

《计算机体系结构》第三章流水线技术
《计算机体系结构》第二章计算机指令集结构设计
《计算机体系结构》第一章计算机体系结构的基本概念
《多媒体技术与应用》第四章多媒体视频信息处理
《多媒体技术与应用》第六章多媒体软件系统及制作技
《多媒体技术与应用》第五章媒体辅助设备
《多媒体技术与应用》第二章多媒体光盘存储系统（2/2）
《多媒体技术与应用》第二章多媒体光盘存储系统（1/2）
《多媒体技术与应用》第三章多媒体音频信息处理
《多媒体技术与应用》第七章面向网络的多媒体技术
《多媒体技术与应用》第二章多媒体计算机系统的组成
《多章单片机应用系统的扩展》讲义
《计算机体系结构》第五章存储层次
《计算机体系结构》第六章输入输出系统
《计算机体系结构》第七章多处理机
《C语言》课程教学课件（PPT讲稿）第七章函数
《C语言》课程教学课件（PPT讲稿）第三章顺序结构程序设计
《C语言》课程教学课件（PPT讲稿）第二章数据类型、运算符与表达式
《C语言》课程教学课件（PPT讲稿）第八章指针及链表
《C语言》课程教学课件（PPT讲稿）第六章数组
《C语言》课程教学课件（PPT讲稿）第四章选择结构程序设计
成都信息工程大学（成都信息工程学院）：《管理信息系统》课程PPT教学课件_第六讲信息系统的规划
成都信息工程大学（成都信息工程学院）：《管理信息系统》课程PPT教学课件_第四讲数据资源管理技术
成都信息工程大学（成都信息工程学院）：《管理信息系统》课程PPT教学课件_第一讲管理信息系统入门

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录

《计算机体系结构》第四章指令级并行

《计算机体系结构》 第四章 指令级并行

《计算机体系结构》第四章指令级并行