当前位置：和泉文库 > 计算机 > 浏览文档

中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）RISC-V指令集及简单实现

文件格式：PPTX，文件大小：3.2MB，售价：23.86元

文档详细内容（约113页）

小结:指令集架构 ISA需考虑的问题 Class of isa Memory addressing Types and sizes of operands Operations Control flow instructions Encoding an isa ·ISA的类型通用寄存器型占主导地位寻址方式重要的寻址方式:偏移寻址方式,立即数寻址方式寄存器间址方式 SPEC测试表明,使用频度达到75%-99% 偏移字段的大小应该在12-16bits,可满足75%99%的需求立即数字段的大小应该在8-16bits,可满足50%-80%的需求操作数的类型和大小对单字、双字的数据访问具有较高的频率支持64位双字操作,更具有一般性 202125

小结：指令集架构 • ISA需考虑的问题 – Class of ISA – Memory addressing – Types and sizes of operands – Operations – Control flow instructions – Encoding an ISA – …… • ISA的类型 – 通用寄存器型占主导地位 • 寻址方式 – 重要的寻址方式: 偏移寻址方式, 立即数寻址方式, 寄存器间址方式 • SPEC测试表明，使用频度达到 75%--99% – 偏移字段的大小应该在 12 - 16 bits, 可满足75%-99%的需求 – 立即数字段的大小应该在 8 -16 bits, 可满足50%-80%的需求 • 操作数的类型和大小 – 对单字、双字的数据访问具有较高的频率 – 支持64位双字操作，更具有一般性 2021/2/5 22

MIPS MIPS是最典型的RSC指令集架构 Stanford,1980年提出,主要受到IBM801小型机的影响第一个商业实现是R2000(1986) 最初的设计中,其整数指令集仅有58条指令,直接实现单发射、顺序流水线 30年来,逐步增加到约400条指令 ·主要特征 Load/ Store型结构,专门的指令完成存储器与寄存器之间的传送 ALU类指令的操作数来源于寄存器或立即数(指令中的特定区域) 降低了指令集和硬件的复杂性,依赖于优化编译技术,方便了简单流水线的实现 2021/2/5 2

MIPS • MIPS是最典型的RISC 指令集架构 – Stanford， 1980年提出，主要受到IBM801 小型机的影响 – 第一个商业实现是R2000（1986） – 最初的设计中，其整数指令集仅有58条指令，直接实现单发射、顺序流水线 – 30年来，逐步增加到约400条指令。 • 主要特征： – Load/Store型结构，专门的指令完成存储器与寄存器之间的传送 – ALU类指令的操作数来源于寄存器或立即数（指令中的特定区域） – 降低了指令集和硬件的复杂性，依赖于优化编译技术，方便了简单流水线的实现 2021/2/5 23

主要缺陷针对特定的微体系架构的实现方式(5级流水、单发射、顺序流水线)进行过度的优化设计延迟转移问题导致超标量等复杂流水线的实现难度,当无法有效填充延迟槽时会导致代码尺寸变大 ·MIPS-I中暴露出其他流水线冲突(load、乘除引起的冲突)采用简单的 Interlocking简单又高效,但为了保持兼容性,仍然保留了延迟转移 ISA对位置无关的代码( position-independent code,PC)支持不足。直接跳转没有提供P相对寻址,需要通过间接跳转方式实现PC,增加了代码尺寸, 降低了性能 2014年MIPS的修订,改进了PC-相对寻址针对数据),但仍然要多条指令才能完成 16位位宽立即数消耗了大量编码空间,只有少量的编码空间可供扩展指令 ·2014修订版,保存有1/64的编码空间供扩展架构师如果想采用压缩指令编码来降低代码空间,就不得不采用新的指令编码乘除指令使用了特殊的寄存器(HILO),导致上下文切换内容、指令条数代码尺寸增加,微架构实现复杂 2021/2/5

• 主要缺陷： – 针对特定的微体系架构的实现方式（5级流水、单发射、顺序流水线）进行过度的优化设计 • 延迟转移问题导致超标量等复杂流水线的实现难度，当无法有效填充延迟槽时会导致代码尺寸变大 • MIPS-I中暴露出其他流水线冲突（load、乘除引起的冲突）采用简单的 Interlocking 简单又高效，但为了保持兼容性，仍然保留了延迟转移 – ISA对位置无关的代码（position-independent code, PIC)支持不足。 • 直接跳转没有提供PC相对寻址，需要通过间接跳转方式实现PIC，增加了代码尺寸，降低了性能 • 2014年MIPS的修订，改进了PC-相对寻址(针对数据)，但仍然要多条指令才能完成 – 16位位宽立即数消耗了大量编码空间，只有少量的编码空间可供扩展指令 • 2014修订版，保存有1/64的编码空间供扩展 • 架构师如果想采用压缩指令编码来降低代码空间，就不得不采用新的指令编码 – 乘除指令使用了特殊的寄存器（HI,LO)，导致上下文切换内容、指令条数、代码尺寸增加，微架构实现复杂 2021/2/5 24

ISA假设浮点操作部件是一个独立的协处理器,使得单芯片实现无法最优例如,整型数与浮点数的转换结果写到浮点数寄存器,使用结果时,需要额外的mo指令,更糟糕的是浮点数寄存器文件与整型数寄存器文件之间的传输,需要有显式的延迟槽在标准的AB中,保留两个整型寄存器用于内核程序,减少了用户程序可用的寄存器数使用特殊指令处理未对齐的load和 Istore会消耗大量的操作码空间, 并使除了最简单的实现之外的其他实现复杂化时钟速率CPI的权衡使得架构师省略了整数大小比较和分支指令。随着分支预测和静态CMOS逻辑的出现,这种权衡在今天已经不太合适了。除了技术方面,MIPS是非开放的专属指令集,不能自由使用 2021/2/5

– ISA假设浮点操作部件是一个独立的协处理器，使得单芯片实现无法最优 • 例如，整型数与浮点数的转换结果写到浮点数寄存器，使用结果时，需要额外的mov指令，更糟糕的是浮点数寄存器文件与整型数寄存器文件之间的传输，需要有显式的延迟槽 – 在标准的ABI中，保留两个整型寄存器用于内核程序，减少了用户程序可用的寄存器数 – 使用特殊指令处理未对齐的load和store会消耗大量的操作码空间，并使除了最简单的实现之外的其他实现复杂化。 – 时钟速率/CPI 的权衡使得架构师省略了整数大小比较和分支指令。随着分支预测和静态CMOS逻辑的出现，这种权衡在今天已经不太合适了。 – 除了技术方面，MIPS是非开放的专属指令集，不能自由使用 2021/2/5 25

SPARO Sun Microsystems的专属指令集可迫溯到 Berkeley risC-和RSC亚项目;最近的32位版本的 ISA SPARC8 SPARC VE8主要特征用户级整型SA90条指令;硬件支持IEE754-1985标准的浮点数(50条);特权级指令20条主要问题 SPARC使用了寄存器窗口来加速函数调用当函数调用所需的栈空间超过了窗口的寄存器数,性能会急剧下降。对于所有的实现来说,寄存器窗口都消耗很大的面枳和功耗分支使用条件码这些条件码由于在一些指令之间创建了额外的依赖关系,增加了体系结构状态并使实现复杂化 load和 store相邻寄存器对的指令对于简单的微体系结构很有吸引力,可以在很少增加硬件复杂性的情况下提高吞吐量. 遗憾的是当使用寄存器重命名使实现复杂化,因为在寄存器文件中数据在物理上可能不再相邻浮点寄存器文件和整数寄存器文件之间的移动必须使用内存系统作为中介,限制了系统性能 2021/2/5

SPARC • Sun Microsystems的专属指令集 – 可追溯到Berkeley RISC-I和RISC-II项目；最近的32位版本的ISA SPARC V8 • SPARC V8 主要特征 – 用户级整型ISA 90条指令；硬件支持IEEE 754-1985标准的浮点数(50条) ；特权级指令 20条 • 主要问题 – SPARC使用了寄存器窗口来加速函数调用 • 当函数调用所需的栈空间超过了窗口的寄存器数，性能会急剧下降。对于所有的实现来说，寄存器窗口都消耗很大的面积和功耗 – 分支使用条件码 • 这些条件码由于在一些指令之间创建了额外的依赖关系，增加了体系结构状态并使实现复杂化 – load和store相邻寄存器对的指令 • 对于简单的微体系结构很有吸引力，可以在很少增加硬件复杂性的情况下提高吞吐量。 • 遗憾的是当使用寄存器重命名使实现复杂化，因为在寄存器文件中数据在物理上可能不再相邻 – 浮点寄存器文件和整数寄存器文件之间的移动必须使用内存系统作为中介，限制了系统性能 2021/2/5 26

点击进入文档下载页（PPTX格式）

共113页，可试读30页，点击继续阅读 ↓↓

您可能感兴趣的文档

《信息安全工程》课程教学资源（PPT课件讲稿）第3章密码学基础
南京大学：《面向对象技术 OOT》课程教学资源（PPT课件讲稿）敏捷软件开发 Agile Software Development
《计算机应用基础》课程教学资源（PPT课件讲稿）第5章文件文档工具
西安电子科技大学：《操作系统 Operating Systems》课程教学资源（PPT课件讲稿）Chapter 05 输入输出 Input/Output
《人工智能》课程教学资源（PPT课件讲稿）Ch10 Auto-encoders（Auto and variational encoders v.9r6）
《ARM Cortex-M3权威指南》课程教学资源（PPT课件讲稿）Cortex M3 存储系统访问
北京师范大学现代远程教育：《计算机应用基础》课程教学资源（PPT课件讲稿）第四篇数据处理与数据分析
《数字图像处理》课程教学资源（PPT课件讲稿）第八章形态学处理
《计算机网络技术及应用》课程教学资源（PPT课件讲稿）第十一章网络安全
《人工智能》课程教学资源（PPT课件讲稿）第13章智能优化计算简介
清华大学出版社：《计算机网络安全与应用技术》课程教学资源（PPT课件讲稿）第5章 Windows NT/2000的安全与保护措施
上海交通大学：《计算机组成原理 Computer Organization》课程教学资源（PPT课件讲稿）Chapter 4A The Processor, Part A
电子科技大学：《计算机操作系统》课程教学资源（PPT课件讲稿）第三章存储管理 Memory Management
《C语言教程》课程教学资源（PPT课件讲稿）第三章 C语言程序设计初步
《数据结构》课程教学资源（PPT课件讲稿）第十章内部排序
清华大学：A Pivotal Prefix Based Filtering Algorithm for String Similarity Search（PPT讲稿）
河南中医药大学（河南中医学院）：《计算机文化》课程教学资源（PPT课件讲稿）第四章计算机软件系统（主讲：许成刚、阮晓龙）
《人工智能技术导论》课程教学资源（PPT课件讲稿）第1章人工智能概述
山东大学：《微机原理及单片机接口技术》课程教学资源（PPT课件讲稿）第八章数据通信
信息和通信技术ICT（PPT讲稿）浅谈信息技术和低碳经济（中国科学技术大学：王煦法）
北京大学：网络信息体系结构（PPT讲稿）Web-based Information Architecture
P2P Tutorial（PPT讲稿）
微软分布式计算技术（PPT讲稿）Dryad and DryadLINQ
《数字图像处理》课程教学资源（PPT课件）第6章图像复原

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录