当前位置：和泉文库 > 计算机 > 浏览文档

中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第5章指令级并行

• 指令集并行的基本概念及挑战 • 软件方法挖掘指令集并行 – 基本块内的指令集并行 • 硬件方法挖掘指令集并行 – Scoreboard – Tomasulo • 跨越基本块的指令集并行 • 基于硬件的推测执行 • 以多发射和静态调度来挖掘指令集并行 • 以动态调度、多发射和推测执行来挖掘指令集并行

文件格式：PPTX，文件大小：6MB，售价：42.19元

共295页，可试读40页，点击往前阅读 ↑↑

文档详细内容（约295页）

O无回路的循环间相关(2/4)- Example: A, B, C, d distinct nonoverlapping for(i=1;<=100;i=i+1){ Iteration i i+1 A[]=A+B];/*S1 B[+1]=C]+D[]}/*S2* B[+1] Non-Circular Loop-Carried Dependence S2 S2 Dependency Graph 1.S1和S2没有相关,S1和S2互换不会影响程序的正确性 2.在第一次循环中,S1依赖于前一次循环的B1] 3.51依赖上一次循环的S2,但S2不依赖S1 计算机体系结构

2021/2/7 计算机体系结构 27 无回路的循环间相关（2/4)- Example:A,B,C,D distinct & nonoverlapping for (i=1; i<=100; i=i+1) { A[i] = A[i] + B[i]; /* S1 */ B[i+1] = C[i] + D[i];} /* S2 */ Non-Circular Loop-Carried Dependence 1. S1和S2没有相关，S1和S2互换不会影响程序的正确性 2. 在第一次循环中，S1依赖于前一次循环的B[1]. 3. S1依赖上一次循环的S2，但S2不依赖S1

O循环间相关(3/4)-循环变换 OLD for(i=1;<=100;|=计+1){ A[]=A+B];/*S1 B[+]=C[]+D[i];}/*S2 NEW A[1]=A[1]+B[1] for(=1;iK=99;i=i+1){ B[+1]=C印]+Dj A[+1]=A[i+1]+B[i+1]; B[101]=C[100]+D[100]; 计算机体系结构

2021/2/7 计算机体系结构 28 循环间相关（3/4）-循环变换 OLD: for (i=1; i<=100; i=i+1) { A[i] = A[i] + B[i]; /* S1 */ B[i+1] = C[i] + D[i];} /* S2 */ NEW: A[1] = A[1] + B[1]; for (i=1; i<=99; i=i+1) { B[i+1] = C[i] + D[i]; A[i+1] = A[i+1] + B[i+1]; } B[101] = C[100] + D[100];

◎循环相关(4/4)- Dependence Distance 通常循环间相关呈现为递推关系 for(i=1;i<N;++)A印]=A[-1]+B[j 相关的距离可能大于1 for(i=4;i<N;计+)A[=A[i4]+B[]; 可以通过循环展开增加循环内的并行性 for(i=4;i<N;ⅰ=i+4) A[]=A[ⅰ4]+B[i]; A[+1]=A[i3]+B[+1]; A[+2]=A[i2]+B[i+2]; A[+3]=A[i1]+B[+3]; 计算机体系结构

2021/2/7 计算机体系结构 29 循环间相关（4/4）-Dependence Distance 通常循环间相关呈现为递推关系 for (i=1; i<N; i++) A[i] = A[i-1] + B[i]; 相关的距离可能大于1 for (i=4; i<N; i++) A[i] = A[i-4] + B[i]; 可以通过循环展开增加循环内的并行性 for (i=4; i<N; i=i+4) { A[i] = A[i-4] + B[i]; A[i+1] = A[i-3] + B[i+1]; A[i+2] = A[i-2] + B[i+2]; A[i+3] = A[i-1] + B[i+3]; }

循环展开示例小结循环展开对循环间无关的程序是有效降低 stal的手段(对循环级并行) 指令调度,必须保证程序运行的结果不变注意循环展开中的Load和 Store不同次循环的Load和 Store是相互独立的。需要分析对存储器的引用,保证他们没有引用同一地址不同次的循环,使用不同的寄存器删除不必要的测试和分支后,需调整循环步长等控制循环的代码移动SD到SUB和BNEz后,需要调整SD中的偏移计算机体系结构

2021/2/7 计算机体系结构 30 循环展开示例小结 • 循环展开对循环间无关的程序是有效降低 stalls的手段(对循环级并行）. • 指令调度，必须保证程序运行的结果不变 • 注意循环展开中的Load和Store,不同次循环的Load 和Store 是相互独立的。需要分析对存储器的引用，保证他们没有引用同一地址. • 不同次的循环，使用不同的寄存器 • 删除不必要的测试和分支后，需调整循环步长等控制循环的代码. • 移动SD到SUBI和BNEZ后，需要调整SD中的偏移

04/10-Review 指令级并行LP):流水线的平均CPI Pipeline cp= Ideal Pipeline cpl+ Struct Stalls RAW Stalls War Stalls WaW stalls Control Stalls 提高指令级并行的方法软件方法:指令流调度,循环展开,软件流水线, trace scheduling 硬件方法软件方法:指令流调度-循环展开指令调度,必须保证程序运行的结果不变 ·偏移量的修改寄存器的重命名循环步长的调整计算机体系结构

2021/2/7 计算机体系结构 31 04/10-Review • 指令级并行(ILP) : 流水线的平均CPI – Pipeline CPI = Ideal Pipeline CPI + Struct Stalls + RAW Stalls + WAR Stalls + WAW Stalls + Control Stalls +…… – 提高指令级并行的方法 • 软件方法：指令流调度，循环展开，软件流水线，trace scheduling • 硬件方法 • 软件方法：指令流调度-循环展开 • 指令调度，必须保证程序运行的结果不变 • 偏移量的修改 • 寄存器的重命名 • 循环步长的调整

点击进入文档下载页（PPTX格式）

共295页，可试读40页，点击继续阅读 ↓↓

您可能感兴趣的文档

档案数字化基本程序与要求（PPT讲稿）
Computer Graphics（PPT讲稿）INFORMATION VISUALIZATION
北京大学：C++模板与STL库介绍（PPT讲稿）
《数据库基础》课程教学资源（PPT课件讲稿）第四章数据查询
《网络搜索和挖掘关键技术 Web Search and Mining》课程教学资源（PPT讲稿）Lecture 08 Scoring and results assembly
上海海事大学：《数字图像处理》课程教学资源（PPT课件讲稿）Unit 7 Introduction to Digital Image Processing
Performance Evaluation of Long Range Dependent Queues（PPT讲稿）
《C语言程序设计》课程电子教案（PPT课件讲稿）第二章基本数据类型及运算
南京大学：《面向对象技术 OOT》课程教学资源（PPT课件讲稿）模式&框架 Pattern & Framework
《数据库系统概论 An Introduction to Database System》课程教学资源（PPT课件讲稿）第二讲关系数据库
《计算机辅助设计》课程介绍
沈阳工程学院：《面向对象程序设计》课程教学大纲（适用专业：计算机科学与技术专业）
上海交通大学：《程序设计》课程教学资源（PPT课件讲稿）第14章输入输出与文件
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第7章多处理器及线程级并行
南京大学：《编译原理》课程教学资源（PPT课件讲稿）第五章语法制导的翻译
河南中医药大学：《网络技术实训》课程教学资源（PPT课件讲稿）第一阶段组网（主讲：路景鑫）
《SQL基础教程》课程教学资源（PPT课件讲稿）第6章数据操作与SQL语句
《计算机基础及C语言程序设计》课程PPT教学课件（讲稿）第1章概论
西安交通大学：《网络与信息安全》课程PPT教学课件（网络入侵与防范）身份认证
《计算机网络和因特网》教学资源（PPT讲稿）网络互连（概念, IP 地址, IP 路由, IP 数据报, 地址解析）
《高级语言程序设计》课程教学资源（试卷习题）试题四（无答案）
上海交通厌：《通信网络》课程教学资源（PPT讲稿）DELAY MODELS IN DATA NETWORKS、LITTLE’S LAW、ARRIVAL MODEL、M/M/X QUEUING MODELS
《软件工程》课程教学资源（PPT课件讲稿）第7章软件测试
《计算机网络安全》课程教学资源（PPT课件讲稿）第二章密码学技术

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录