7.2.1SMD阵列机的基本结构 SMD阵列机通常是由一个主机(也称为控制器CU)、m个 处理单元PE、m个存储器模块和一个互连网络IN组成。系统工 作时,由主机CU将指令广播到各个处理单元PE,其中活跃的处 理单元将以同步方式执行这一指令。从形式上看,是一种单指 令流的方式。各处理单元从各自的存储器模块中读取所需要的 数据,即多数据流的方式。互连网络IN用来将各个处理单元PE及 与存储器模块连接起来。IN有时也称为对准(Aigηment)或排 列( Permutation)网络
7.2.1 SIMD阵列机的基本结构 SIMD阵列机通常是由一个主机(也称为控制器CU)、n个 处理单元 PE、m个存储器模块和一个互连网络IN组成。系统工 作时,由主机CU将指令广播到各个处理单元PE,其中活跃的处 理单元将以同步方式执行这一指令。从形式上看,是一种单指 令流的方式。各处理单元从各自的存储器模块中读取所需要的 数据, 即多数据流的方式。互连网络IN用来将各个处理单元PE及 与存储器模块连 接起来。IN有时也称为对准(Alignment)或排 列(Permutation)网络
在SIMD阵列机中,根据存储器模块的设置方式其结构可分为分 布式存储器阵列机和集中共享存储器阵列机,图7.2所示是一种分布 式存储器结构的阵列机。为了便于标量数据处理,在有的阵列机中 还配有标量处理机 标量处理机 大容量存储器 ↑标量指令 阵列控制部件控制部件与数据存储主机 IO用户 向量指令广播总线 网络控制 PEo PE, PE 数据总线 LMo LMI LMr-1 互连网络 图72分布式存储器阵列机
图7.2 分布式存储器阵列机 在SIMD阵列机中,根据存储器模块的设置方式其结构可分为分 布式存储器阵列机和集中共享存储器阵列机,图7.2 所示是一种分布 式存储器结构的阵列机。为了便于标量数据处理,在有的阵列机中 还配有标量处理机
1分布式存储器阵列机 分布式存储器SIMD阵列机的结构如图7.2所示,包括主机(控制器 CU)和多个功能相同的处理单元PE( Processing Element)。其中每一个 PE单元都拥有自己的本地存储器LM( Local Memory),各PE单元通过互 连网络IN连接,实现数据交换。且配置有专门的标量处理机。 (1)主机(控制器CU)有自己的存储器,用以存储系统/用户程序 和共用数据。 (2)控制器CU的职责包括两个方面 ①与用户连接,接收用户输入的程序或命令 ②对指令译码,并判断在哪些处理单元上执行。 对于标量指令,由控制器CU或专门的标量处理机完成;对于向量 指令,则广播给各PE单元执不 (3)各处理单元同步执行来自控制閤CU的操作命令,从本地存储 器中获取数据,处理结果再送回到本地存储器中去。但是在实际运算中往 往不是所有的处理单元都必须参与,通常是通过屏蔽字来实现,仅允许未 屏蔽的活跃PE参与运算
1.分布式存储器阵列机 分布式存储器SIMD阵列机的结构如图7.2所示,包括主机(控制器 CU)和多个功能相同的处理单元PE(Processing Element)。其中每一个 PE单元都拥有自己的本地存储器LM(Local Memory),各PE单元通过互 连网络IN连接,实现数据交换。且配置有专门的标量处理机。 (1)主机(控制器CU)有自己的存储器,用以存储系统/用户程序 和共用数据。 (2)控制器CU的职责包括两个方面: ① 与用户连接,接收用户输入的程序或命令; ② 对指令译码,并判断在哪些处理单元上执行。 对于标量指令,由控制器CU或专门的标量处理机完成;对于向量 指令,则广播给各PE单元执行。 (3)各处理单元同步执行来自控制器CU的操作命令,从本地存储 器中获取数据,处理结果再送回到本地存储器中去。但是在实际运算中往 往不是所有的处理单元都必须参与,通常是通过屏蔽字来实现,仅允许未 屏蔽的活跃PE参与运算
(4)控制器cU控制互连网络IN,使参加运算的PE单元通过IN互连,进 行数据交换。对于两个不能直接连接的PE,可经过中间P进行数据传送 5)各处理单元之间的同步由控制部件中的硬件电路来实现,确保所 有活跃的P按同一时钟执行指令。 2.集中共享存储器阵列机 集中共享存储器SIMD阵列机的结构如图7.3所示,由主机(控制器CU) 和多个功能相同的处理单元PE构成。每个P单元不再拥有本地存储器,而 是共享存储器阵列SM( Shared Memory)。各P单元之间通过互连网络 IN连接,且通过互连网络与共享存储器阵列连接
(4)控制器CU控制互连网络IN,使参加运算的PE单元通过IN互连,进 行数据交换。对于两个不能直接连接的PE,可经过中间PE进行数据传送。 (5)各处理单元之间的同步由控制部件中的硬件电路来实现,确保所 有活跃的PE按同一时钟执行指令。 2.集中共享存储器阵列机 集中共享存储器SIMD阵列机的结构如图7.3所示,由主机(控制器CU) 和多个功能相同的处理单元PE构成。每个PE单元不再拥有本地存储器,而 是共享存储器阵列SM(Shared Memory)。各PE单元之间通过互连网络 IN连接,且通过互连网络与共享存储器阵列连接
标量处理机 大容量存储器 标量指令 阵列控制部件指今「控制部件与数据存储「主机 IO用户 向量指令广播总线 网络控制 PE PEr PEn 据总线 互连网络IN SMo SMI SMm-I 图73集中共享存储器阵列机
图7.3 集中共享存储器阵列机