Amdahl定律的推导 改进之前程序运行总时间可写为:Tn=T(1-F+F), 改进之后由于其中部分操作加快,总时间降为: T(1-F2+) 根据加速比定义,有: 20019.1 计算机系统结构
2001.9.1 计算机系统结构 11 Amdahl定律的推导 e e e n o n e e n o e o o e e S F F T T S S F T T F T T F F (1 ) 1 (1 ) (1 ) 根据加速比定义,有: 改进之后由于其中部分操作加快,总时间降为: 改进之前程序运行总时间可写为:
Amdahl定律的图形 从图1.2可以看出,增大Se和Fe对Sn都有提升作用;但当Fe固定时 味增大Se对Sn的作用会越来越不显著 极限2= 极限1 Fe=F Fe=F (设Fa>Fa) 0.0 图1.2 Amdahl定律的图形 20019.1 计算机系统结构 12
2001.9.1 计算机系统结构 12 Amdahl定律的图形 Sn 极限 2 = 1 2 1 Fe 极限 1 = 1 1 1 Fe Fe=Fe2 Fe=Fe1 1.0 (设 Fe2 > Fe1) 0.0 1.0 Se 图 1.2 Amdahl 定律的图形 从图1.2可以看出,增大Se和Fe对Sn都有提升作用;但当Fe固定时 ,一味增大Se对Sn的作用会越来越不显著
1.2.2CPI与程序执行时间Te(P11) CPI是衡量CPU执行指令效率的重要指标。让我们先考虑一个标准测 速程序的全部执行时间Te和其中所有第i种指令的累计时间Ti,易知 T=C×CP× CYCLE T=IC XCPL XCYCLE 其中: CYCLE EC=∑C 另一方面,我们又可以写 =27=2(C,xCP1 XCYCLE)=∑(C×CPD) cYCLE 比较上面第一式与最后一式,可以得到CPI与CPI的关系 ICxCPI=>(C×CPl 或者写为CPⅠ ∑×CP,它表明CP为所有CP的加权平均值 20019.1 计算机系统结构
2001.9.1 计算机系统结构 13 1.2.2 CPI与程序执行时间Te(P11) CPI是衡量CPU执行指令效率的重要指标。让我们先考虑一个标准测 速程序的全部执行时间Te和其中所有第i种指令的累计时间Ti,易知 或者写为 ( ),它表明 为所有 的加权平均值。 ( ) 比较上面第一式与最后一式,可以得到 与 的关系 另一方面,我们又可以写 , i n i i i n i i i n i i i n i i i n i e i n i i i i i e CPI CPI CPI IC IC CPI IC CPI IC CPI T T IC CPI CYCLE IC CPI CYCLE IC IC f CYCLE T IC CPI CYCLE T IC CPI CYCLE CPI CPI ( ) ( ) 1 其中: 1 1 i 1 1 1 1
1.2.3每秒百万指令数MIPS与每秒百万浮点数 MFLOPS (P11) MPS 10 10 ×10-6,主要用于标量计算机 lC×CPI× CYCLE CPI MPS MFLOPS 每次浮点运算所需指令条数 主要用于向量计算机。 例题:P10,例1.1~例1.5。 P33,题12,题13,题14 20019.1 计算机系统结构
2001.9.1 计算机系统结构 14 1.2.3 每秒百万指令数MIPS与每秒百万浮点数MFLOPS (P11) ,主要用于向量计算机。 每次浮点运算所需指令条数 ,主要用于标量计算机; MIPS MFLOPS CPI f IC CPI CYCLE IC T IC MIPS e 6 6 6 10 10 10 例题:P10,例1.1~例1.5。 P33,题12 ,题13 ,题14
例题选讲(1) 例1.1(P10) Amdahl定律公式,已知:Fe=0.4,Se=10,求Sn。 它说明局部(40%)的大幅度改进(10倍)对全局的作用要小得 多(156倍)。 例12(P10) Amdahl定律公式,已知方案1:Fe1=02,Se=10,求Sn; 已知方案2:Fe2=0.5,Se2=2,求Sn2。 它说明大范围的小幅度改进(方案2)效果可能更好。 20019.1 计算机系统结构
2001.9.1 计算机系统结构 15 例题选讲(1) • 例1.1(P10) Amdahl定律公式,已知:Fe=0.4,Se=10,求Sn。 它说明局部(40%)的大幅度改进(10倍)对全局的作用要小得 多(1.56倍)。 • 例1.2(P10) Amdahl定律公式,已知方案1 :Fe1=0.2,Se1=10,求Sn1; 已知方案2 :Fe2=0.5,Se2=2,求Sn2 。 它说明大范围的小幅度改进(方案2)效果可能更好