例7.2一台32个处理器的计算机,对远程存储器 访问时间为2000ns。除了通信以外,假设计算中 的访问均命中局部存储器。当发出一个远程请求 时,本处理器挂起。处理器时钟周期为10ns,如 果指令基本的CPⅠ为10设所有访存均命中 Cache) ,求在没有远程访问的状态下与有0.5%的指令需 要远程访问的状态下,前者比后者快多少? 2021/2/7 计算机体系结构
例7.2 一台32个处理器的计算机,对远程存储器 访问时间为2000ns。除了通信以外,假设计算中 的访问均命中局部存储器。当发出一个远程请求 时,本处理器挂起。处理器时钟周期为10ns,如 果指令基本的CPI为1.0(设所有访存均命中Cache) ,求在没有远程访问的状态下与有0.5%的指令需 要远程访问的状态下,前者比后者快多少? 2021/2/7 计算机体系结构 21
解有0.5%远程访问的机器的实际CPI为 CPⅠ=基本CP+远程访问率×远程访问开销 =1.0+0.5%×远程访问开销 远程访问开销=远程访问时间/时钟时间 =2000n5/10ns=200个时钟周期 CPI=1.0+05%×200=20 它为只有局部访问的机器的2.0/1.0=2倍, 因此在没有远程访问的状态下的机器速度是有 0.5%远程访问的机器速度的2倍。 2021/2/7 计算机体系结构
解 有0.5%远程访问的机器的实际CPI为: CPI=基本CPI+远程访问率×远程访问开销 =1.0+0.5%×远程访问开销 远程访问开销=远程访问时间/时钟时间 =2000ns/10ns=200个时钟周期 ∴ CPI=1.0+0.5%×200=2.0 它为只有局部访问的机器的2.0/1.0=2倍, 因此在没有远程访问的状态下的机器速度是有 0.5%远程访问的机器速度的2倍。 2021/2/7 计算机体系结构 22
存储器访问的序问题 存储同一性( Consistency) 不同处理器发出的所有存储器操作的顺序问题(即针 对不同存储单元或相同存储单元) 访问所有存储单元的全序问题 ·存储一致性( Coherence): 不同处理器访问相同存储单元时的访问顺序问题 访问每个 Cache块的局部序问题 2021/2/7 计算机体系结构
存储器访问的序问题 • 存储同一性(Consistency): −不同处理器发出的所有存储器操作的顺序问题(即针 对不同存储单元或相同存储单元) −访问所有存储单元的全序问题 • 存储一致性(Coherence): −不同处理器访问相同存储单元时的访问顺序问题 −访问每个Cache块的局部序问题 2021/2/7 计算机体系结构 23
存储同一性( Memory Consistency) TABLE 3. 3: Can Both r1 and r2 be Set to O? Core CI Core C2 Comments SI: X= NEW S2: y=NEW: /*Initially,x=0&y=0*/ LI: rl=y; L2:r2=x; 可能的执行顺序(假设可全乱序假设遵循 SC Model): SILIS2L2(O,NEW S2S1LIL2(NEW, NEW) LIS1S2L2(0, NEW) L2SIL1S2(0,0) S1LIL2S2(0, NEW S2S1L2LI(NEW,NEW) LIS1L2S2(0,NEW L2S1S2L1 (NEW,O) SIS2LIL2(NEW,NEW) S2L1SIL2(NEW,NEW) L1S2S1L2(0, NEW) L2L1S1S2(0,0) SIS2L2L1(NEW,NEW) S2L1L2SI(NEW,O) L1S2L2S1(0,0)L2L1S2S1(0,0) SIL2L1S2(0, NEW S2L2SILI(NEW,O L1L2S1S2(00) L2S2S1LI(NEW,O SIL2S2LI(NEW,NEW S2L2LISI(NEW,O) L1L2S2S1(0,0) L2S2L1S1(0,0) 2021/2/7 计算机体系结构
存储同一性(Memory Consistency) 可能的执行顺序(假设可全乱序|假设遵循SC Model): S1L1S2L2 (0,NEW) S2S1L1L2 (NEW, NEW) L1S1S2L2 (0, NEW) L2S1L1S2(0,0) S1L1L2S2 (0,NEW) S2S1L2L1(NEW,NEW) L1S1L2S2(0,NEW) L2S1S2L1 (NEW,0) S1S2L1L2(NEW,NEW) S2L1S1L2(NEW,NEW) L1S2S1L2(0,NEW) L2L1S1S2(0,0) S1S2L2L1(NEW,NEW) S2L1L2S1(NEW,0) L1S2L2S1(0,0) L2L1S2S1(0,0) S1L2L1S2(0,NEW) S2L2S1L1(NEW,0) L1L2S1S2(0,0) L2S2S1L1(NEW,0) S1L2S2L1(NEW,NEW) S2L2L1S1(NEW,0) L1L2S2S1(0,0) L2S2L1S1(0,0) 2021/2/7 计算机体系结构 24
存储一致性( Coherence) load rl. men core I core 2 n load rI core I T add rl, rl. #l core I core 2 store rl, mem(Al Example of incoherence 2021/2/7 计算机体系结构
存储一致性(Coherence) Example of incoherence 2021/2/7 计算机体系结构 25