薇1.超标量整数指令流水线 理 t1 t2 t3 t4 t5 8 接 术PFU 技 5i7 12 i4 1618 第 版D1U 4 5 12 i4 16 18 机 械 D2 U 1i3 业 2|i4i6 8 出 社EXU 12 i4 16 18 WB U 1 i5 i7 2 16 18
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 1. 超标量整数指令流水线
2. Pentium的指令配对 微机原理与接口技术·第4版机械工业出 IF i1是简单指令 并且i2也是简单指令 并且i1不是转移指令 并且i和i2不存在数据相关 THEN i1发往U流水线 i2发往V流水线 版ELSE 社 i1发往U流水线 i2做为下对指令的第1条指令i1
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 2. Pentium的指令配对 IF i1是简单指令 并且i2也是简单指令 并且i1不是转移指令 并且i1和i2不存在数据相关 THEN i1发往U流水线 i2发往V流水线 ELSE i1发往U流水线 i2做为下对指令的第1条指令i1
1013 Pentium的动态分支预测 微机原理与接口技术·第4版机械 32位 32位 2位 转移指令地址目标指令地址历史 不发生分支的移动方向 新项不分支 不分支 不分支 不分支 4/ 历史:10 历史:01 历史:00 出预测:分 预测:分 预测:分 预测:不分支 支 分支 分支 分支 分支 发生分支的移动方向
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 10.1.3 Pentium的动态分支预测 32位 32位 2位 转移指令地址 目标指令地址 历史 不分支 历史:11 预测:分 支 历史:10 预测:分 支 分支 不分支 历史:01 预测:分 支 分支 不分支 历史:00 预测:不分支 分支 不分支 新项 分支 发生分支的移动方向 不发生分支的移动方向
102动态执行技术 理P6微结构的IA-32处理器 Pentium Pro、 Pentium Il和 Pentium Ill 术>动态执行是一系列技术的总称 寄存器重命名 ●乱序执行 静态分支预测 出 动态分支预测 ●推测执行 提高并行处理指令能力
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 10.2 动态执行技术 ➢P6微结构的IA-32处理器 Pentium Pro、Pentium II和Pentium III ➢动态执行是一系列技术的总称 寄存器重命名 乱序执行 静态分支预测 动态分支预测 推测执行 提高并行处理指令能力
1021指令级并行 骂≥指令级并行IP 置·研究程序中指令之间存在的并行性 发掘指令之间的并行执行能力 提高处理器内部操作的并行程度 没有相关的多个指令可以在超标量处理器的多 个流水线或多个执行单位同时执行 业●存在相关的多个指令需要尽量消除相关,也实 出 现并行执行 指令是处理器执行的基本单位
微 机 原 理 与 接 口 技 术 · 第 4 版 机 械 工 业 出 版 社 10.2.1 指令级并行 ➢指令级并行ILP 研究程序中指令之间存在的并行性 ➢发掘指令之间的并行执行能力 提高处理器内部操作的并行程度 没有相关的多个指令可以在超标量处理器的多 个流水线或多个执行单位同时执行 存在相关的多个指令需要尽量消除相关,也实 现并行执行 指令是处理器执行的基本单位