《并行计算:Parallel Computing》 结构 编程算法应用 §2.2并行计算机性能测评 徐悦牲Yueshen Xu)) ysxu@xidian.edu.cn 软件工程系 西安电子科技大学
§2.2 并行计算机性能测评 徐悦甡(Yueshen Xu) ysxu@xidian.edu.cn 软件工程系 西安电子科技大学 《并行计算:Parallel Computing》 结构 编程 算法 应用
本节提纲 历些毛子代枚大多 XIDIAN UNIVERSITY ▣并行计算机访存模型 ■均匀存储访问与非均匀存储访问 ■高速缓存存储访问 从存储器的角度 ■非远程存储访问模型等 ■体系结构与访存模型的关系 口并行计算机性能测评 ■并行计算机的基本性能指标 性能测评的后半部 ■加速比性能测评 分内容,很重要 ■可扩展性性能测评 2
并行计算机访存模型 均匀存储访问与非均匀存储访问 高速缓存存储访问 非远程存储访问模型等 体系结构与访存模型的关系 本节提纲 从存储器的角度 并行计算机性能测评 并行计算机的基本性能指标 加速比性能测评 可扩展性性能测评 性能测评的后半部 分内容,很重要 2
并行计算机性能测评 历些毛子种枝大” XIDIAN UNIVERSITY )上节课已讲 ▣并行计算机性能测评慨述 ■硬件层面或机器层面 ■程序层面或软件层面或算法层面 计算开销 硬件层面测试测评 通信开销 并行计算机 存储开销 性能测评 加速比性能测评 程序/软件层面测评 可扩展性测评
并行计算机性能测评 上节课已讲 并行计算机性能测评概述 硬件层面或机器层面 程序层面或软件层面或算法层面 并行计算机 性能测评 硬件层面测试测评 程序/软件层面测评 计算开销 通信开销 存储开销 3 加速比性能测评 可扩展性测评
并行计算机性能测评 历些毛子科枚大多 XIDIAN UNIVERSITY )上节课已讲 ▣CPU的部分通用性能指标 ■浮点运算数(FLOPS) > 每秒浮点运算次数,floating-point operations per second, FLOPS >原因: 1.并行计算,特别是科学计算中大量使用浮点数,即小数 -2.浮点数运算比整数运算更花费时间,更有测量的意义与效果 ■执行时间T >T comput:计算时间,Tparo:为并行开销时间,T comm: 为相互通 信时间 Tn=T comput T paro+Tcomm 4
并行计算机性能测评 上节课已讲 CPU的部分通用性能指标 浮点运算数(FLOPS) 执行时间 T ➢ T comput :计算时间,T paro :为并行开销时间,T comm:为相互通 信时间 ➢ 每秒浮点运算次数,floating-point operations per second, FLOPS ➢ 原因: - 1. 并行计算,特别是科学计算中大量使用浮点数,即小数 - 2. 浮点数运算比整数运算更花费时间,更有测量的意义与效果 T n = T comput + T paro+ T comm 4
并行计算机性能测评 历些毛子种枝大兽 XIDIAN UNIVERSITY )上节课已讲 口算法层面程序层面性能评测 ■开始关注软件,而不是硬件 ■加速比性能评测 >并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的 执行速度相对于串行算法(或串行程序)的执行速度加快了多少倍 >Amdahl定律 >Gustafson定律 Sun Ni定律 ■可扩展性评测 >等效率度量标准 >等速度度量标准 >平均延迟度量标准
并行计算机性能测评 上节课已讲 算法层面/程序层面性能评测 ➢ 并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的 执行速度相对于串行算法(或串行程序)的执行速度加快了多少倍 ➢ Amdahl 定律 ➢ Gustafson定律 ➢ Sun Ni定律 可扩展性评测 ➢ 等效率度量标准 ➢ 等速度度量标准 ➢ 平均延迟度量标准 开始关注软件,而不是硬件 加速比性能评测 5