远程访问开销=远程访问时间/时钟时间 =2000ns/10ns=200个时钟 .CPI=10+0.5%×200=2.0 它为只有局部访问的机器的2.0/1.0=2倍, 因此在没有远程访问的状态下的机器速度是有 0.5 远程访问的机器速度的2倍 问题的解决 并行性不足:通过采用并行性更好的算法来解决 远程访问延迟的降低:靠体系结构支持和编程技术
远程访问开销=远程访问时间/时钟时间 =2000ns/10ns=200 ∴ CPI=1.0+0.5%×200=2.0 它为只有局部访问的机器的2.0/1.0=2倍, 因此在没有远程访问的状态下的机器速度是有 0.5% 远程访问的机器速度的2倍。 ◆ 问题的解决 并行性不足: 通过采用并行性更好的算法来解决 远程访问延迟的降低: 靠体系结构支持和编程技术
篑 体7.6并行程序的计算/通信比率 ◆反映并行程序性能的一个重要的度量 计算与通信的比率 狗 ◆计算/通信比率随着处理数据规模的增大而增 加;随着处理器数目的增加而降低
7.1.6 并行程序的计算/通信比率 ◆ 反映并行程序性能的一个重要的度量 计算与通信的比率 ◆ 计算/通信比率随着处理数据规模的增大而增 加;随着处理器数目的增加而降低
7.2多处理机的存储器体系结构 7.2.1集中式共享存储器体系结构 ◆多个处理器共享一个存储器。 ◆当处理器规模较小时,这种机器十分经济。 ◆支持对共享数据和私有数据的 Cache缓存。 私有数据供一个单独的处理器使用,而共 享数据供多个处理器使用。 ◆共享数据进入 Cache产生了一个新的问题 Cache的一致性问题
7.2 多处理机的存储器体系结构 ◆ 多个处理器共享一个存储器。 ◆ 当处理器规模较小时,这种机器十分经济。 ◆ 支持对共享数据和私有数据的Cache缓存。 私有数据供一个单独的处理器使用,而共 享数据供多个处理器使用。 ◆ 共享数据进入Cache产生了一个新的问题 Cache的一致性问题 7.2.1 集中式共享存储器体系结构
例两个处理器 Cache对应同一存储单元产生出不同的值 假设:初始条件下各个 Cache无X值,X单元值为1; 写直达方式的 Cache。 时间事件 CPU A Cache内容 CPU B Cache内容x单元存储器内容 I CPUA读X 2CPUB读X 3CPUA将0存入X
例 两个处理器Cache对应同一存储器单元产生出不同的值 假设:初始条件下各个Cache无X值,X单元值为1; 写直达方式的Cache 时间 事件 CPU A Cache 内容 CPU B Cache 内容 X单元存储器内容 0 1 1 CPU A读X 1 1 2 CPU B读X 1 1 3 CPU A将0存入X 0 1 0
存储器是一致的(非正式地定义 如果对某个数据项的任何读操作均可得到其最 新写入的值,则认为这个存储系统是一致的。 ◆存储系统行为的两个不同方面 返回给读操作的是什么值 什么时候才能将已写入的值返回给读操作 项编写正确共享存储器程序必须明确的问题 满足条件 ①处理器P对X进行一次写之后又对X进行读 读和写之间没有其它处理器对X进行写,则 读的返回值总是写进的值
存储器是一致的(非正式地定义) 如果对某个数据项的任何读操作均可得到其最 新写入的值,则认为这个存储系统是一致的。 ◆ 存储系统行为的两个不同方面 • 返回给读操作的是什么值 • 什么时候才能将已写入的值返回给读操作 项编写正确共享存储器程序必须明确的问题 ◆ 满足条件 ① 处理器P对X进行一次写之后又对X进行读, 读和写之间没有其它处理器对X进行写,则