Man memory vecter FP addsubtract latore FPrmultpty FP divide veder reuters Integer L aEter 2021/1/29 算机体系结构
2021/1/29 计算机体系结构 22
Vector arithmetic execution 使用较深的流水线(=>fast clock)执行向量元素的操作 123 由于向量元素相互独立,简化 了深度流水线的控制(=>no azaras Six stage multiply pipeline V3<-V1*v2 2021/1/29 计算机体系结构
Vector Arithmetic Execution • 使用较深的流水线(=> fast clock) 执行向量元素的操作 • 由于向量元素相互独立,简化 了深度流水线的控制 (=> no hazards!) 2021/1/29 计算机体系结构 V 1 V 2 V 3 V3 <- v1 * v2 Six stage multiply pipeline 23
Vector unit structure unctional Unit Vector Registers Elements Elements Elements Elements 仓,4,8 1,5,9 2,6,16, 3,7,11, Lane Memory Subsystem 2021/1/29 计算机体系结构
Vector Unit Structure 24 Lane Functional Unit Vector Registers Memory Subsystem Elements 0, 4, 8, … Elements 1, 5, 9, … Elements 2, 6, 10, … Elements 3, 7, 11, … 2021/1/29 计算机体系结构
Vector instruction execution ADDV CA,B 使用一条流水化的功 使用4条流水化的功能 能部件热行 部件执行 A[6]B[6] A[24]B[24]A[25]B[25]A[26]B[26]A[27B[27 A[5]B[5] A[20]B[20]A[21]B[21]A[22]B[22]A[23]B[23] A[4]B[4] A[16]B[16]A[17]B[17A18]B[18]A[19]B[19] A[3]B[3] A[12]B[12]A[13]B[13]A[14]B[14]A[15]B[15] C[2] C[8] C[9] C[10] C[11] C[1] C[4] C[5] C[6] C[7] C[0] CLOT C[1] C[2] C[3] 2021/1/29 机体系结构
Vector Instruction Execution 2021/1/29 计算机体系结构 ADDV C,A,B C[1] C[2] C[0] A[3] B[3] A[4] B[4] A[5] B[5] A[6] B[6] 使用一条流水化的功 能部件执行 C[4] C[8] C[0] A[12] B[12] A[16] B[16] A[20] B[20] A[24] B[24] C[5] C[9] C[1] A[13] B[13] A[17] B[17] A[21] B[21] A[25] B[25] C[6] C[10] C[2] A[14] B[14] A[18] B[18] A[22] B[22] A[26] B[26] C[7] C[11] C[3] A[15] B[15] A[19] B[19] A[23] B[23] A[27] B[27] 使用4条流水化的功能 部件执行 25
Interleaved Vector Memory System Cray-1, 16 banks, 4 cycle bank busy time 12 cycle latency Bank busy time: Time before bank ready to accept next request Base stride Vector Registers Address 式 Generator 0123456789 ABCDEF Memory banks 2021/1/29 计算机体系结构
Interleaved Vector Memory System 26 0 1 2 3 4 5 6 7 8 9 A B C D E F + Base Stride Vector Registers Memory Banks Address Generator Cray-1, 16 banks, 4 cycle bank busy time, 12 cycle latency • Bank busy time: Time before bank ready to accept next request 2021/1/29 计算机体系结构