当前位置：和泉文库 > 计算机 > 浏览文档

《计算机系统和系统结构》课程教学资源（PPT课件讲稿）第四章流水线技术

4.1 指令级并行的概念 4.2 指令的动态调度 4.3 转移预测技术 4.4 多发射技术 4.5 向指令级并行的支持与限制 4.6 Intel Pentium 4 实例分析

文件格式：PPT，文件大小：858KB，售价：26.96元

共145页，可试读30页，点击往前阅读 ↑↑

文档详细内容（约145页）

循环体间相关常常以重现的形式出现的: for(i=2;1<=100;1=i+1) Y[]=Y[i-1]+Y[ 重现是对一个变量赋予前面一个循环体中一个变量的值, 而且往往是最近的一个循环体中的变量

21 循环体间相关常常以重现的形式出现的： for (i=2;1<=100;i=i+1) Y[i]=Y[i-1]+Y[i]; 重现是对一个变量赋予前面一个循环体中一个变量的值，而且往往是最近的一个循环体中的变量

检测这种循环依赖关系有两点很重要的原因:一是有些系统结构(如向量计算机)可以专门支持执行这种循环结构的程序度 ;二是有些存在循环依赖关系的程序也可以获得很高的并行 for(i=6;1<=100;1=i+1) ￥[Y[i-5]+Y[; 在第i次循环中,循环引用了第i-5个元素,因此称该循环的相关距离是5。许多有相邻体间相关的循环,它们的相关距离是1。相关距离越大,通过展开循环可以获得的并行度就越同

22 检测这种循环依赖关系有两点很重要的原因：一是有些系统结构（如向量计算机）可以专门支持执行这种循环结构的程序；二是有些存在循环依赖关系的程序也可以获得很高的并行度。 for (i=6;1<=100;i=i+1) Y[i]=Y[i-5]+Y[i]; 在第i次循环中，循环引用了第i-5个元素，因此称该循环的相关距离是5。许多有相邻体间相关的循环，它们的相关距离是1。相关距离越大，通过展开循环可以获得的并行度就越高

2.循环展开技术循环展开技术是利用多次复制循环体并相应调整展开后的指令和循环结束条件,增加有效操作时间与控制操作时间的比率。这种技术也给编译器进行指令调度带来了更大的空间例4-2:将例4-1中的循环展开成3次得到4个循环体,再对展开后的指令序列在不调度和调度两种情况下,分析代码的性能

23 循环展开技术是利用多次复制循环体并相应调整展开后的指令和循环结束条件，增加有效操作时间与控制操作时间的比率。这种技术也给编译器进行指令调度带来了更大的空间 2.循环展开技术例4-2：将例4-1中的循环展开成3次得到4个循环体，再对展开后的指令序列在不调度和调度两种情况下，分析代码的性能

解:假定R的初值为32的倍数,即循环次数为4的倍数。寄存器分配如下: (展开后的循环体内不重复使用寄存器 F0、F4:用于展开后的第1个循环体 F2:保存常数; F6和F8:用于展开后的第2个循环体; F10和F12:用于第3个循环体 F14和F16:用于第4个循环体

24 解：假定R1的初值为32的倍数，即循环次数为4的倍数。寄存器分配如下：（展开后的循环体内不重复使用寄存器。） F0、F4：用于展开后的第1个循环体； F2：保存常数； F6和F8：用于展开后的第2个循环体； F10和F12：用于第3个循环体； F14和F16：用于第4个循环体

(1)展开后没有调度的代码流出时钟流出时钟 F0,0R1) ADDD F12F10F2 15 (空转) (空转) ADDD F4 FOF2 3 (空转) (空转) 16(R1)F1218 (空转) LD F1424(R)、19 SD 0(R),F4 (空转) LD F6,-8(R1)7 ADDD F16..F2 2 (空转) (空转 ADDd F8.F6 F2 9 (空转) (空转) 10 SD -24(R1).F1624 (空转) SUBI R1,R1,#32 SD 8(R)F812 (空转) LD F10-16(R1)13 RILoo (空转) 14 (空转)

25 (1) 展开后没有调度的代码流出时钟 Loop: LD F0,0(R1) 1 （空转） 2 ADDD F4,F0,F2 3 （空转） 4 （空转） 5 SD 0(R1),F4 6 LD F6,-8(R1) 7 （空转） 8 ADDD F8,F6,F2 9 （空转） 10 （空转） 11 SD -8(R1),F8 12 LD F10,-16(R1) 13 （空转） 14 流出时钟 ADDD F12,F10,F2 15 （空转） 16 （空转） 17 SD -16(R1),F12 18 LD F14,-24(R1) 19 （空转） 20 ADDD F16,F14,F2 21 （空转） 22 （空转） 23 SD -24(R1),F16 24 SUBI R1,R1,#32 25 （空转） 26 BNEZ R1,Loop 27 （空转） 28

点击进入文档下载页（PPT格式）

共145页，可试读30页，点击继续阅读 ↓↓

您可能感兴趣的文档

《计算机算法基础》课程教学资源（PPT课件讲稿）分枝－限界法
东南大学：《数据结构》课程教学资源（PPT课件讲稿）贪心算法
《网络编程实用教程》教学资源（PPT课件讲稿）第4章 MFC编程
航空航天（PPT课件讲稿）Mechanics——Particle Motion
上海交通大学：《软件工程导论》课程教学资源（PPT课件讲稿）第十三讲软件项目中的人员管理
Data Mining and Model Choice in Supervised Learning
武昌理工学院：《操作系统原理》课程教学资源（PPT课件）第一章操作系统概述（主讲：温静）
《Computer Networking：A Top Down Approach》英文教材教学资源（PPT课件讲稿，6th edition）Chapter 8 网络安全 Network Security
西安电子科技大学：《现代密码学》课程教学资源（PPT课件讲稿）第六章数字签名算法
华中师范大学：智能与分布计算（PPT课件讲稿）语义网与本体 Semantic Web & Ontology（Introduction）
中国科学技术大学：《计算机科学导论》课程教学资源（PPT课件讲稿）第五讲经典计算的计算模型（主讲：陈意云）
《高级语言程序设计 Advanced Programming》课程教学资源（PPT课件讲稿）第5章循环结构程序设计
四川大学：《计算机操作系统 Operating System Principles》课程教学资源（PPT课件讲稿）第6章存储器管理
山东大学：《微机原理及单片机接口技术》课程教学资源（PPT课件讲稿）第二章微型计算机基础知识
《The C++ Programming Language》课程教学资源（PPT课件讲稿）Lecture 05 Object-Oriented Programming
四川大学：《计算机操作系统 Operating System Principles》课程教学资源（PPT课件讲稿）第7章虚拟存储器管理
《计算机软件技术基础》课程电子教案（PPT课件讲稿）第9章存储管理
上海交通大学：传感器网络研究 Research On Sensor Nets（主讲：伍民友）
南京航空航天大学：《数据结构》课程教学资源（PPT课件讲稿）第五章数组和广义表
《大数据挖掘与应用技术》课程教学资源（PPT课件讲稿）第12章 Hibernate持久化技术
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第7章多处理器及线程级并行 7.3 分布式共享存储器体系结构 7.4 Models of Memory Consistency
Acknowledged Broadcasting and Gossiping in ad hoc radio networks
Apache Spark：Intro to Spark（Lightning-fast cluster computing）
中国科学技术大学：《网络信息安全 NETWORK SECURITY》课程教学资源（PPT课件讲稿）第三章局域网安全技术及应用

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录