Q4:写策略 程序对存储器读操作占26%,写操作占9% 写所占的存储器访问比例9/(100+26+9)大约为7% 占访问数据 Cache的比例:9/(26+9)大约为25% 大概率事件优先原则一优化 Cache的读操作 Amah定律:不可忽视“写”的速度 写”的问题 读出标识,确认命中后,对 Cache写(串行操作) Cache与主存内容的一致性问题 写策略就是要解决:何时更新主存问题 计算机体系结构 Chapter526
计算机体系结构 Chapter5.26 Q4: 写策略 ▪ 程序对存储器读操作占26%, 写操作占9% • 写所占的存储器访问比例 9/(100+26+9) 大约为7% • 占访问数据Cache的比例: 9/(26+9) 大约为25% ▪ 大概率事件优先原则-优化Cache的读操作 ▪ Amdahl定律:不可忽视“写”的速度 ▪ “写”的问题 • 读出标识,确认命中后,对Cache写 (串行操作) • Cache与主存内容的一致性问题 ▪ 写策略就是要解决: 何时更新主存问题
两种写策略 写直达法( Write through) 优点:易于实现,容易保持不同层次间的一致性 ·缺点:速度较慢 写回法 ·优点:速度快,减少访存次数 缺点:一致性问题 当发生写失效时的两种策略 按写分配法 Write allocate):写失效时,先把所写单元所在块调入 Cache,然后再进行写入,也称写时取( Fetch on write)方法 不按写分配法( no-write allocate):写失效时,直接写入下一级存储器 而不将相应块调入 Cache,也称绕写法( Write around) 原则上以上两种方法都可以应用于写直达法和写回法,一般情况下 Write Back Write allocate Write through H no-write allocate 计算机体系结构 Chapter527
计算机体系结构 Chapter5.27 两种写策略 ▪ 写直达法(Write through) • 优点:易于实现,容易保持不同层次间的一致性 • 缺点:速度较慢 ▪ 写回法 • 优点:速度快,减少访存次数 • 缺点:一致性问题 ▪ 当发生写失效时的两种策略 • 按写分配法(Write allocate):写失效时,先把所写单元所在块调入 Cache,然后再进行写入,也称写时取(Fetch on Write)方法 • 不按写分配法(no-write allocate): 写失效时,直接写入下一级存储器, 而不将相应块调入Cache,也称绕写法(Write around) • 原则上以上两种方法都可以应用于写直达法和写回法,一般情况下 - Write Back 用Write allocate - Write through 用no-write allocate
Review 存储系统的层次结构 CPU Register CACHE MEMORY yo device Speed(ns): 0.25ns Ins 100ns sms Size(bytes): 500B 64KB 512MB 100GB Cache基本知识 Q1: Block placement Q2: Block identification Q3: Block replacement Q4: Write strategy 计算机体系结构 Chapter528
计算机体系结构 Chapter5.28 Review ▪ 存储系统的层次结构 ▪ Cache基本知识 • Q1: Block placement • Q2: Block identification • Q3: Block replacement • Q4: Write strategy 0.25ns Speed (ns): 1ns 100ns 500B 100GB Size (bytes): 64KB 512MB 5ms CPU Register C A C H E MEMORY I/O device
Alpha AX21064 Cache结构(数据 Cache) 基本技术特性 容量8KB,Bock32B,共256个 Block 直接映象 ·写直达法,写失效时, no-write a| ocate方法 每个字为8个字节 21064物理地址34位 ·21位tag##8位 index#5位块内偏移 Cache命中的步骤 读命中 写命中 s Cache失效 Cache向cPU发暂停信号 块传送,21064 Cache与下一级存储器之间数据通路16字节,传送全部 32字节需要10个 cycles 计算机体系结构 Chapter529
计算机体系结构 Chapter5.29 Alpha AX 21064 Cache结构(数据Cache) ▪ 基本技术特性 • 容量 8KB ,Block 32B, 共256个Block • 直接映象 • 写直达法,写失效时,no-write allocate 方法 • 每个字为8个字节 ▪ 21064物理地址34位 • 21位tag##8位index ##5位块内偏移 ▪ Cache命中的步骤 • 读命中 • 写命中 ▪ Cache失效 • Cache向CPU发暂停信号 • 块传送,21064 Cache与下一级存储器之间数据通路16字节,传送全部 32字节需要10个cycles
Alpha AX21064 Cache结构(数据 Cache) Block k⊙ Block address offset V CPU 21 B<5 address Data Data Ta valid T Data <256 (256 4:1Mu Write buffer Lower level m
计算机体系结构 Chapter5.30 Alpha AX 21064 Cache结构(数据Cache) ▪ 基本技术特性 • Block 32bytes per Block, 共256个Block • 直接映象 • 写直达法,写失效时,no-write allocate 方法 ▪ 21064物理地址34位 • 21位tag##8位index ##5位块内偏移 ▪ Cache命中的步骤 • 读命中 • 写命中 ▪ Cache失效 • Cache向CPU发暂停信号 • 块传送,21064Cache与下一级存储器之间数据通路16字节,传送全部32 字节需要10个cycles