03/06-eveW-性能 性能度量 响应时间( response time) 吞吐率 Throughpu) cPU执行时间= ICx CPI X T CPI Cycles per Instruction MIPS E Millions of instructions per second Latency versus Bandwidth Latency指单个任务的执行时间, Bandwidth指单位时间完成的任务量 rate Latency的提升滞后于带宽的提升(在过去的30年) Amdahl'sLaw用来度量加速比( speedup) 性能提升受限于任务中可加速部分所占的比例 应用于多处理器系统的基本假设∶在给定的问题规模下,研究随着处理器数 目的增 变化 Benchmarks:指一组用于测试的程序 比较计算机系统的性能 speC benchmark:针对一组应用综合性能值采用 SPEC ratios的几何平均 2021/2/5
03/06-review-性能 • 性能度量 – 响应时间 (response time) – 吞吐率 (Throughput) • CPU 执行时间 = IC × CPI × T – CPI ( Cycles per Instruction) • MIPS = Millions of Instructions Per Second • Latency versus Bandwidth – Latency指单个任务的执行时间,Bandwidth 指单位时间完成的任务量 (rate) – Latency 的提升滞后于带宽的提升 (在过去的30年) • Amdahl’s Law 用来度量加速比(speedup) – 性能提升受限于任务中可加速部分所占的比例 – 应用于多处理器系统的基本假设:在给定的问题规模下,研究随着处理器数 目的增加性能的变化 • Benchmarks:指一组用于测试的程序 – 比较计算机系统的性能 – SPEC benchmark : 针对一组应用综合性能值采用SPEC ratios 的几何平均 2021/2/5 2
03/06- review-能耗/功耗 给定负载情况下能耗越少,能效越高,特别是 对电池供电的移动设备。 功耗已经成为系统设计的重要约束条件之 A chip might be limited to 120 watts(cooling power supply) Power Consumed Dynamic power Static Power 晶体管开和关的切换导致的功耗为动态功耗 由于晶体管静态漏电流导致的功耗称为静态功耗 通过降低频率可节省功耗 降低电压可降低功耗和能耗 2021/2/5
03/06-review-能耗/功耗 • 给定负载情况下能耗越少,能效越高, 特别是 对电池供电的移动设备。 • 功耗已经成为系统设计的重要约束条件之一 – A chip might be limited to 120 watts (cooling + power supply) • Power Consumed = Dynamic Power + Static Power – 晶体管开和关的切换导致的功耗为动态功耗 – 由于晶体管静态漏电流导致的功耗称为静态功耗 • 通过降低频率可节省功耗 • 降低电压可降低功耗和能耗 2021/2/5 3
Recap:指令集架构 ·软件子系统与硬件子系统的关键界面 software 一组直接由硬件执行的指令,包括 程序员可见的机器状态 FF instruction set FTTTTTT 程序员可见的指令集合(操作机器状态的长和ane 应具备的特性 成本 简洁性 架构和具体实现分离:可持续多代,以保持向后( backward)兼容 可扩展空间:可用于不同应用领域( desktops, servers, embedded applications 易于编程/编译/链接:为高层软件的设计与开发提供方便的功能 性能:方便低层硬件子系统高效实现 ·IBM360是第一个将ISA与其实现分离的系列机 给定一个SA,可以有不同的实现方式;例如AMD/ ntel cPu都是X86-64 指令集。 ARMISA也有不同的实现方式 2021/2/5
Recap:指令集架构 • 软件子系统与硬件子系统的关键界面 • 一组直接由硬件执行的指令,包括 – 程序员可见的机器状态 – 程序员可见的指令集合(操作机器状态的指令) • 应具备的特性 – 成本 – 简洁性 – 架构和具体实现分离:可持续多代,以保持向后(backward) 兼容 – 可扩展空间:可用于不同应用领域(desktops, servers, embedded applications) – 易于编程/编译/链接:为高层软件的设计与开发提供方便的功能 – 性能:方便低层硬件子系统高效实现 • IBM 360 是第一个将ISA与其实现分离的系列机 – 给定一个ISA,可以有不同的实现方式;例如AMD/Intel CPU 都是X86-64 指令集。ARM ISA 也有不同的实现方式 2021/2/5 4 instruction set software hardware
用户级ISA和特权级ISA Application Software Applica tion Software System Calls System calls Operating system Operating System System ISA User ISA ISA L System ISA User IsA ABI Hardware Hardware (b) 重要的系统界面( System Interface) ISA界面( Instruction Set architecture) ABI界面( Application Binary Interface) ISA:用户级ISA+特权级ISA 用户级ISA适用于操作系统和应用程序 特权级ISA适用于硬件资源的管理(操作系统)
用户级ISA和特权级ISA • 重要的系统界面(System Interface) – ISA界面(Instruction Set Architecture) – ABI界面(Application Binary Interface) • ISA:用户级ISA+特权级ISA – 用户级ISA 适用于操作系统和应用程序 – 特权级ISA 适用于硬件资源的管理(操作系统) 2021/2/5 5
ISA的实现 ISA通常设计时会考虑特定的微体系结构(实现)方式。 Accumulator→ hardwired, unpipelined(硬布线、非流水) -ClSC→ microcoded(微程序) RSC→ hardwired, pipelined(硬布线、流水线) VLIW fixed-latency order parallel pipelines(固定延 时、顺序执行、多条流水线并行) JM→ software interpretation(软件解释) ISA理论上可以用任何微体系结构(实现)方式 Intel lvy Bridge: hardwired pipelined CISC ( x86)machine with some microcode support(硬布线流水化(部分微程 序支持)) Spike: Software- interpreted RISC-V machine(模拟器) ARM Jazelle: A hardware JVM processor 2021/2/5
ISA的实现 • ISA 通常设计时会考虑特定的微体系结构(实现)方式。 – Accumulator hardwired, unpipelined (硬布线、非流水) – CISC microcoded (微程序) – RISC hardwired, pipelined(硬布线、流水线) – VLIW fixed-latency in-order parallel pipelines (固定延 时、顺序执行、多条流水线并行) – JVM software interpretation(软件解释) • ISA 理论上可以用任何微体系结构(实现)方式 – Intel Ivy Bridge: hardwired pipelined CISC (x86) machine (with some microcode support) (硬布线流水化(部分微程 序支持)) – Spike: Software-interpreted RISC-V machine (模拟器) – ARM Jazelle: A hardware JVM processor 2021/2/5 6