Cache Memory 小而快(SRAM)的存储技术 存储正在访问的部分指令和数据 用于減少平均访存时间 通过保持最近访问的数据在处理器附近来挖掘时间局部性 通过以块为单位在不同层次移动数据来挖掘空间局部性 主要目标 提高访存速度 降低存储系统成本 2021-2-4 计算机体系结构
Cache Memory ? • 小而快(SRAM)的存储技术 − 存储正在访问的部分指令和数据 • 用于减少平均访存时间 − 通过保持最近访问的数据在处理器附近来挖掘时间局部性 − 通过以块为单位在不同层次移动数据来挖掘空间局部性 • 主要目标: − 提高访存速度 − 降低存储系统成本 2021-2-4 计算机体系结构 17
Cache无处不在 体系结构中, Cache无处不在 寄存器: Cache on variab|es 二级 Cache: Cache on memory Memory: Cache on hard disks 存储最近执行的程序和数据 Hard disks可以视为主存的扩展(WM) 分支目标缓存及分支预测缓存 缓存分支目标及预测信息 2021-2-4 计算机体系结构
Cache 无处不在 • 体系结构中,Cache无处不在 • 寄存器:Cache on variables • 一、二级Cache: Cache on memory • Memory:Cache on hard disks − 存储最近执行的程序和数据 − Hard disks可以视为主存的扩展(VM) • 分支目标缓存及分支预测缓存 − 缓存分支目标及预测信息 2021-2-4 计算机体系结构 18
review 长流水线(浮点数流水线)引起的“相关”问题 ·长流水线中精确中断的处理方法 浮点数流水线的性能 RAW相关引起的性能损失是主要因素 浮点数流水线示例( MIPS R4000) ·存储系统的分层结构 目标:速度快、容量大、价格低的存储系统 局部性原理 存储系统涉及的基本概念:Bock,命中和失效,数据-致性等 Cache和VM ·存储系统的性能评估与优化 平均访存时间=命中时间+失效率*失效开销 2021-2-4 计算机体系结构
-review • 长流水线(浮点数流水线)引起的“相关”问题 • 长流水线中精确中断的处理方法 • 浮点数流水线的性能 − RAW相关引起的性能损失是主要因素 • 浮点数流水线示例 (MIPS R4000) • 存储系统的分层结构 − 目标:速度快、容量大、价格低的存储系统 − 局部性原理 − 存储系统涉及的基本概念:Block, 命中和失效,数据一致性等 − Cache 和 VM • 存储系统的性能评估与优化 平均访存时间= 命中时间 + 失效率*失效开销 2021-2-4 计算机体系结构 19
4.2 Cache基本知识 Sample Memory hierarchy CPU LO ICache LO DCache L2 1 Cache I Cache backside option Disk L2 L2 L2 Cache Cach Cache Ia ape Juke Be 10 Adapter Main Memory 2021-2-4 计算机体系结构
4.2 Cache基本知识 2021-2-4 计算机体系结构 20
Q1:映象规则 当要把一个块从主存调入 Cache时,如何放置问题 三种方式 全相联方式:即所调入的块可以放在 cache中的任何位置 直接映象方式:主存中每一块只能存放在 cache中的唯位置 一般,主存块地址i与 cachet中块地址的关系为 j=imod(M),M为 cache中的块数 组相联映象:主存中每一块可以被放置在 Cache中唯一的一个组中的任意 个位置,组由若干块构成,若一组由n块构成,我们称N路组相联 组间直接映象 组内全相联 若 cache中有G组,则主存中的第i块的组号K K=imod (G) 2021-2-4 计算机体系结构
Q1:映象规则 • 当要把一个块从主存调入Cache时,如何放置问题 • 三种方式 − 全相联方式:即所调入的块可以放在cache中的任何位置 − 直接映象方式:主存中每一块只能存放在cache中的唯一位置 一般,主存块地址i 与cache中块地址j 的关系为: j = i mod (M) ,M为cache中的块数 − 组相联映象:主存中每一块可以被放置在Cache中唯一的一个组中的任意一 个位置,组由若干块构成,若一组由n块构成,我们称N路组相联 ü 组间直接映象 ü 组内全相联 若cache中有G组,则主存中的第i 块的组号K K = i mod (G), 2021-2-4 计算机体系结构 21