当前位置：和泉文库 > 计算机 > 浏览文档

中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第三章流水线技术

文件格式：PPTX，文件大小：1.83MB，售价：23.86元

文档详细内容（约113页）

O Pipelining for Unconditional PC-Relative Jumps FDx| M wll target;等同于ja1x0,° offset JDm i pc +=sext(offset) bubble FDX M target: add xl, x2, x3

Pipelining for Unconditional PC-Relative Jumps 27 M W X M W D X M W j target ;等同于 jal x0,offset ; pc +=sext(offset) F D F target: add x1, x2, x3 X D F bubble

Branch Delay Slots 早期的RISC机器的延迟槽技术—改变ISA语义,在分支/跳转后的延迟槽中指令总是在控制流发生变化之前执行 Ox100 j target 0X104 add x1, X2, X3// Executed before target 0x205 target: xor x1, x1, 7 ·软件必须用有用的工作填充延迟槽( delay slots),或者用显式的NOP指令填充延迟槽 FDxM target D XM w add x1, x2, x3 FD X MIW target: xor xl, x1,7

Branch Delay Slots • 早期的RISC机器的延迟槽技术—改变ISA语义，在分支/跳转后的延迟槽中指令总是在控制流发生变化之前执行: – 0x100 j target – 0x104 add x1, x2, x3 // Executed before target – … – 0x205 target: xori x1, x1, 7 • 软件必须用有用的工作填充延迟槽（delay slots），或者用显式的NOP指令填充延迟槽 28 M W X M W D X M W j target F D F target: xori x1, x1, 7 X D F add x1, x2, x3

Post-1990 RISC ISAS取消了延迟槽性能问题当延迟槽中填充了№oPs指令后,增加了- cache的失效率即使延迟槽中只有一个NOP, cache失效导致机器等待使先进的微体系架构复杂化例如4发射30段流水线较好的分支预测技术减少了采用延迟槽技术的动力

Post-1990 RISC ISAs 取消了延迟槽 • 性能问题 – 当延迟槽中填充了NOPs指令后，增加了I-cache的失效率 – 即使延迟槽中只有一个NOP，I-cache失效导致机器等待 • 使先进的微体系架构复杂化 – 例如4发射30段流水线 • 较好的分支预测技术减少了采用延迟槽技术的动力 29

O RISC-V Conditional Branches PCSel B FKill DKill Cond? +4 山 nstruction Cache 切 Fetch Decode EXecute

Decode EXecute Fetch RISC-V Conditional Branches 30 Registers B A Instruction Cache Inst. Inst. Register ALU PC_decode Add Branch? PCSelPC_fetch Kill FKill +4 Cond? PC_execute Add Kill DKill

O Pipelining for Conditional Branches FDX M Wl beg x1,x2,target 川 wI bubble xMl bubble F‖|DX W target: add x1,x2,x3

Pipelining for Conditional Branches 31 M W X M W D X M W F D beq x1, x2, target F target: add x1, x2, x3 X D F bubble bubble F D X M W

点击进入文档下载页（PPTX格式）

共113页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

《网络算法学》课程教学资源（PPT课件讲稿）第二部分端节点算法学第五章拷贝数据
中国科学技术大学：《数值分析》课程教学资源（PPT课件讲稿）第1章插值
中国科学技术大学：《算法基础》课程教学资源（PPT课件讲稿）第四讲递归和分治策略（主讲人：吕敏）
中国科学技术大学：《现代密码学理论与实践》课程教学资源（PPT课件讲稿）第10章密钥管理与其他公钥体制
《数据结构 Data Structure》课程教学资源（PPT课件讲稿）第四章数组、串与广义表
《Computer Networking：A Top Down Approach》英文教材教学资源（PPT课件讲稿，6th edition）Chapter 1 Introduction
《数据结构》课程教学资源（PPT课件讲稿）第五章树
《Computer Networking：A Top Down Approach》英文教材教学资源（PPT课件讲稿，6th edition）Chapter 2 Application Layer
中国科学技术大学：A Practical Verification Framework for Preemptive OS Kernels（PPT讲稿）
《算法设计与分析基础》课程教学课件（PPT讲稿）Chapter 2 Fundamentals of the Analysis of Algorithm Efficiency
中国医科大学：《计算机基础》课程教学资源（PPT课件）第8章 Internet应用基础
RDA Testing & Comparison with AACR2（session 1）
北京航空航天大学：动态拼车服务中的高效插入操作（PPT讲稿）An Efficient Insertion Operator in Dynamic Ridesharing Services
西安电子科技大学：《计算机网络 Computer Networks》课程教学资源（PPT课件讲稿）第一章概述（主讲：马涛）
计算机语言的学科形态与发展历程（PPT课件讲稿）
西安电子科技大学：《计算机网络 Computer Networks》课程教学资源（PPT课件讲稿）概述（主讲：岳鹏）
南京航空航天大学：《C++》课程电子教案（PPT课件讲稿）第4章类的高级部分
《神经网络和模糊系统》课程教学资源（PPT讲稿）第四章突触动力学、非监督学习
《Computer Networking：A Top Down Approach》英文教材教学资源（PPT课件讲稿，4th edition）Chapter 1 Introduction
清华大学：不确定型决策（PPT讲稿）Decision Making under Uncertainty
西安电子科技大学：《计算机网络 Computer Networks》课程教学资源（PPT课件讲稿）第五章传输层
《机器学习》课程教学资源（PPT课件讲稿）第七章贝叶斯分类器 MACHINE LEARNING
清华大学：计算机科学与技术（PPT讲稿）组播 Multicast
《网络算法学》课程教学资源（PPT课件讲稿）第四章原则的运用

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录