Vector Instruction parallelism ·多条向量指令可重叠执行(链接技术 例如:每个向量32个元素,8|anes(车道 Load Unit Multiply Unit Add Unit load m time add load mul add Instruction Issue Complete 24 operations/cycle while issuing 1 short instruction/cycle
Vector Instruction Parallelism • 多条向量指令可重叠执行(链接技术) – 例如:每个向量 32 个元素,8 lanes(车道) 1/27/2021 中国科学技术大学 12 load load mul mul add add Load Unit Multiply Unit Add Unit time Instruction issue Complete 24 operations/cycle while issuing 1 short instruction/cycle
t #2. Conditional xecution Suppose do100i=1,64 if (A(i).ne. o)then A(i)=A(i)-B() endif 100 continue vector-mask contro/使用长度为MvL的布尔向量控 制向量指令的执行 当 vector- mask register使能时,向量指令操作仅对 vector-mask register中对应位为1的分量起作用 1/272021 中国科学技术大学
Vector Opt #2: Conditional Execution • Suppose: do 100 i = 1, 64 if (A(i) .ne. 0) then A(i) = A(i) – B(i) endif 100 continue • vector-mask control 使用长度为MVL的布尔向量控 制向量指令的执行 • 当vector-mask register 使能时,向量指令操作仅对 vector-mask register中 对应位为1的分量起作用 1/27/2021 中国科学技术大学 13