存储系统的设计目标 Workload or Benchmark programs Processor reference strean <op, addr, <op, addr, <op, addr <op, addr, op: i-fetch, read, write M emo 通过优化存備系统的组织来使得针对典型应 用平均访存时间最短 MEM 2021/2/4 计算机体系结构
Processor $ MEM Memory reference stream <op,addr>, <op,addr>,<op,addr>,<op,addr>, . . . op: i-fetch, read, write 通过优化存储系统的组织来使得针对典型应 用平均访存时间最短 Workload or Benchmark programs 存储系统的设计目标 2021/2/4 计算机体系结构 7
基本解决方法:多级层次结构 ·多级分层结构 M2 CPU M1速度最快,容量最小,每位价格最高 Mn速度最慢,容量最大,每位价格最低 并行 ·存储系统接近M1的速度,容量和价格接近Mn 2021/2/4 计算机体系结构 8
基本解决方法:多级层次结构 • 多级分层结构 − M1 速度最快,容量最小,每位价格最高 − Mn速度最慢,容量最大,每位价格最低 • 并行 • 存储系统接近M1的速度,容量和价格接近Mn 2021/2/4 计算机体系结构 8 CPU M1 M2 Mn ………
现代计算机系统的多级存储层次 CPU Register」 CACHE CACHE 3CACHE MEMORY yo device 300ps 1ns3-10ns10-20ns50-100ns5-10ms 1000B64KB256K2-4MB4-16GB4-16TB CPU Register LCAcHE CACHE MEMORY yo device 500ps 2ns10-20ns50-100ns 25-50us 500B 64KB256K256-512GB4-8GB 2021/2/4 计算机体系结构
现代计算机系统的多级存储层次 2021/2/4 计算机体系结构 9 CPU Register MEMORY I/O device L1 C A C H E L2 C A C H E L3 C A C H E 300ps 1ns 3-10ns 10-20ns 50-100ns 5-10ms 1000B 64KB 256K 2-4MB 4-16GB 4-16TB CPU Register MEMORY I/O device L1 C A C H E L2 C A C H E 500ps 2ns 10-20ns 50-100ns 25-50μs 500B 64KB 256K 256-512GB 4-8GB
存储层次工作原理: Locality!! 应用程序局部性原理:给用户 一个采用低成本技术达到的存储容量.(容量大,价格低) 个采用高速存储技术达到的访问速度.(速度快) Temporal Locality(时间局部性) >保持最近访问的数据项最接近微处理器 Spatial Locality(空间局部性) →以由地址连续的若干个字构成的块为单位,从低层 复制到上一层 Lower leve To Processor pper level Memory Memory BlkⅩ From processor Blk Y 2021/2/4 计算机体系结构 10
存储层次工作原理:Locality! • Temporal Locality (时间局部性): =>保持最近访问的数据项最接近微处理器 • Spatial Locality (空间局部性): 以由地址连续的若干个字构成的块为单位,从低层 复制到上一层 2021/2/4 计算机体系结构 10 Lower Level Upper Level Memory Memory To Processor From Processor Blk X Blk Y • 应用程序局部性原理: 给用户 − 一个采用低成本技术达到的存储容量. (容量大,价格低) − 一个采用高速存储技术达到的访问速度.(速度快)
存储层次结构涉及的基本概念 Block Block:不同层次的Bock大小可能不同 命中和命中率 失效和失效率 ·镜像和一致性问题 高层存储器是较低层存储器的一个镜像 高层存储器内容的修改必须反映到低层存储器中 数据一致性问题 ·寻址:不管如何组织,我们必须知道如何访问数据 要求:不同层次上块大小可以不同 在L0 cache可能以 Double, Words,Ha| words,或 bytes 在 Icache仅以 cache line或s!ot为单位访问 在更低层 因此总是存在地址映射问题 ·物理地址格式 Block frame address+ Block offset 2021/2/4 计算机体系结构 11
存储层次结构涉及的基本概念 • Block • Block : 不同层次的Block大小可能不同 • 命中和命中率 • 失效和失效率 • 镜像和一致性问题 • 高层存储器是较低层存储器的一个镜像 • 高层存储器内容的修改必须反映到低层存储器中 • 数据一致性问题 • 寻址:不管如何组织,我们必须知道如何访问数据 • 要求:不同层次上块大小可以不同 • 在L0 cache 可能以Double, Words, Halfwords, 或bytes • 在L1cache仅以cache line 或 slot为单位访问 • 在更低层….. • 因此总是存在地址映射问题 • 物理地址格式 Block Frame Address + Block Offset 2021/2/4 计算机体系结构 11