当前位置：和泉文库 > 计算机 > 浏览文档

中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）RISC-V指令集及简单实现

文件格式：PPTX，文件大小：3.2MB，售价：23.86元

文档详细内容（约113页）

03/06-eveW-性能性能度量响应时间( response time) 吞吐率 Throughpu) cPU执行时间= ICx CPI X T CPI Cycles per Instruction MIPS E Millions of instructions per second Latency versus Bandwidth Latency指单个任务的执行时间, Bandwidth指单位时间完成的任务量 rate Latency的提升滞后于带宽的提升(在过去的30年) Amdahl'sLaw用来度量加速比( speedup) 性能提升受限于任务中可加速部分所占的比例应用于多处理器系统的基本假设∶在给定的问题规模下,研究随着处理器数目的增变化 Benchmarks:指一组用于测试的程序比较计算机系统的性能 speC benchmark:针对一组应用综合性能值采用 SPEC ratios的几何平均 2021/2/5

03/06-review-性能 • 性能度量 – 响应时间 (response time) – 吞吐率 (Throughput) • CPU 执行时间 = IC × CPI × T – CPI ( Cycles per Instruction) • MIPS = Millions of Instructions Per Second • Latency versus Bandwidth – Latency指单个任务的执行时间，Bandwidth 指单位时间完成的任务量（rate） – Latency 的提升滞后于带宽的提升 (在过去的30年） • Amdahl’s Law 用来度量加速比（speedup) – 性能提升受限于任务中可加速部分所占的比例 – 应用于多处理器系统的基本假设：在给定的问题规模下，研究随着处理器数目的增加性能的变化 • Benchmarks：指一组用于测试的程序 – 比较计算机系统的性能 – SPEC benchmark : 针对一组应用综合性能值采用SPEC ratios 的几何平均 2021/2/5 2

03/06- review-能耗/功耗给定负载情况下能耗越少,能效越高,特别是对电池供电的移动设备。功耗已经成为系统设计的重要约束条件之 A chip might be limited to 120 watts(cooling power supply) Power Consumed Dynamic power Static Power 晶体管开和关的切换导致的功耗为动态功耗由于晶体管静态漏电流导致的功耗称为静态功耗通过降低频率可节省功耗降低电压可降低功耗和能耗 2021/2/5

03/06-review-能耗/功耗 • 给定负载情况下能耗越少，能效越高, 特别是对电池供电的移动设备。 • 功耗已经成为系统设计的重要约束条件之一 – A chip might be limited to 120 watts (cooling + power supply) • Power Consumed = Dynamic Power + Static Power – 晶体管开和关的切换导致的功耗为动态功耗 – 由于晶体管静态漏电流导致的功耗称为静态功耗 • 通过降低频率可节省功耗 • 降低电压可降低功耗和能耗 2021/2/5 3

Recap:指令集架构 ·软件子系统与硬件子系统的关键界面 software 一组直接由硬件执行的指令,包括程序员可见的机器状态 FF instruction set FTTTTTT 程序员可见的指令集合(操作机器状态的长和ane 应具备的特性成本简洁性架构和具体实现分离:可持续多代,以保持向后( backward)兼容可扩展空间:可用于不同应用领域( desktops, servers, embedded applications 易于编程/编译/链接:为高层软件的设计与开发提供方便的功能性能:方便低层硬件子系统高效实现 ·IBM360是第一个将ISA与其实现分离的系列机给定一个SA,可以有不同的实现方式;例如AMD/ ntel cPu都是X86-64 指令集。 ARMISA也有不同的实现方式 2021/2/5

Recap：指令集架构 • 软件子系统与硬件子系统的关键界面 • 一组直接由硬件执行的指令，包括 – 程序员可见的机器状态 – 程序员可见的指令集合(操作机器状态的指令) • 应具备的特性 – 成本 – 简洁性 – 架构和具体实现分离：可持续多代，以保持向后（backward) 兼容 – 可扩展空间：可用于不同应用领域（desktops, servers, embedded applications） – 易于编程/编译/链接：为高层软件的设计与开发提供方便的功能 – 性能：方便低层硬件子系统高效实现 • IBM 360 是第一个将ISA与其实现分离的系列机 – 给定一个ISA，可以有不同的实现方式；例如AMD/Intel CPU 都是X86-64 指令集。ARM ISA 也有不同的实现方式 2021/2/5 4 instruction set software hardware

用户级ISA和特权级ISA Application Software Applica tion Software System Calls System calls Operating system Operating System System ISA User ISA ISA L System ISA User IsA ABI Hardware Hardware (b) 重要的系统界面( System Interface) ISA界面( Instruction Set architecture) ABI界面( Application Binary Interface) ISA:用户级ISA+特权级ISA 用户级ISA适用于操作系统和应用程序特权级ISA适用于硬件资源的管理(操作系统)

用户级ISA和特权级ISA • 重要的系统界面（System Interface） – ISA界面（Instruction Set Architecture） – ABI界面（Application Binary Interface） • ISA：用户级ISA+特权级ISA – 用户级ISA 适用于操作系统和应用程序 – 特权级ISA 适用于硬件资源的管理（操作系统） 2021/2/5 5

ISA的实现 ISA通常设计时会考虑特定的微体系结构(实现)方式。 Accumulator→ hardwired, unpipelined(硬布线、非流水) -ClSC→ microcoded(微程序) RSC→ hardwired, pipelined(硬布线、流水线) VLIW fixed-latency order parallel pipelines(固定延时、顺序执行、多条流水线并行) JM→ software interpretation(软件解释) ISA理论上可以用任何微体系结构(实现)方式 Intel lvy Bridge: hardwired pipelined CISC ( x86)machine with some microcode support(硬布线流水化(部分微程序支持)) Spike: Software- interpreted RISC-V machine(模拟器) ARM Jazelle: A hardware JVM processor 2021/2/5

ISA的实现 • ISA 通常设计时会考虑特定的微体系结构（实现）方式。 – Accumulator  hardwired, unpipelined （硬布线、非流水） – CISC  microcoded （微程序） – RISC  hardwired, pipelined（硬布线、流水线） – VLIW  fixed-latency in-order parallel pipelines (固定延时、顺序执行、多条流水线并行） – JVM  software interpretation（软件解释） • ISA 理论上可以用任何微体系结构（实现）方式 – Intel Ivy Bridge: hardwired pipelined CISC (x86) machine (with some microcode support) （硬布线流水化（部分微程序支持）） – Spike: Software-interpreted RISC-V machine （模拟器） – ARM Jazelle: A hardware JVM processor 2021/2/5 6

点击进入文档下载页（PPTX格式）

共113页，可试读30页，点击继续阅读 ↓↓

您可能感兴趣的文档

《信息安全工程》课程教学资源（PPT课件讲稿）第3章密码学基础
南京大学：《面向对象技术 OOT》课程教学资源（PPT课件讲稿）敏捷软件开发 Agile Software Development
《计算机应用基础》课程教学资源（PPT课件讲稿）第5章文件文档工具
西安电子科技大学：《操作系统 Operating Systems》课程教学资源（PPT课件讲稿）Chapter 05 输入输出 Input/Output
《人工智能》课程教学资源（PPT课件讲稿）Ch10 Auto-encoders（Auto and variational encoders v.9r6）
《ARM Cortex-M3权威指南》课程教学资源（PPT课件讲稿）Cortex M3 存储系统访问
北京师范大学现代远程教育：《计算机应用基础》课程教学资源（PPT课件讲稿）第四篇数据处理与数据分析
《数字图像处理》课程教学资源（PPT课件讲稿）第八章形态学处理
《计算机网络技术及应用》课程教学资源（PPT课件讲稿）第十一章网络安全
《人工智能》课程教学资源（PPT课件讲稿）第13章智能优化计算简介
清华大学出版社：《计算机网络安全与应用技术》课程教学资源（PPT课件讲稿）第5章 Windows NT/2000的安全与保护措施
上海交通大学：《计算机组成原理 Computer Organization》课程教学资源（PPT课件讲稿）Chapter 4A The Processor, Part A
电子科技大学：《计算机操作系统》课程教学资源（PPT课件讲稿）第三章存储管理 Memory Management
《C语言教程》课程教学资源（PPT课件讲稿）第三章 C语言程序设计初步
《数据结构》课程教学资源（PPT课件讲稿）第十章内部排序
清华大学：A Pivotal Prefix Based Filtering Algorithm for String Similarity Search（PPT讲稿）
河南中医药大学（河南中医学院）：《计算机文化》课程教学资源（PPT课件讲稿）第四章计算机软件系统（主讲：许成刚、阮晓龙）
《人工智能技术导论》课程教学资源（PPT课件讲稿）第1章人工智能概述
山东大学：《微机原理及单片机接口技术》课程教学资源（PPT课件讲稿）第八章数据通信
信息和通信技术ICT（PPT讲稿）浅谈信息技术和低碳经济（中国科学技术大学：王煦法）
北京大学：网络信息体系结构（PPT讲稿）Web-based Information Architecture
P2P Tutorial（PPT讲稿）
微软分布式计算技术（PPT讲稿）Dryad and DryadLINQ
《数字图像处理》课程教学资源（PPT课件）第6章图像复原

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录