9.1.3通用脉动阵列机的结构 1可编程脉动阵列结构 可编程脉动阵列结构是增设附加硬件,通过编程对阵列的拓 卜结构和互连方式进行重构,以实现不同算法的需求。目前,已 经有可编程脉动阵列芯片,通过编程可重新配置阵列的结构,以 满足不同算法的需求。例如美国普图( Purdue)大学的CHiP ( Configurable Highly Parallel Computer),即可以不同算法构 造出相应的阵列机
9.1.3 通用脉动阵列机的结构 1.可编程脉动阵列结构 可编程脉动阵列结构是增设附加硬件,通过编程对阵列的拓 扑结构和互连方式进行重构,以实现不同算法的需求。目前,已 经有可编程脉动阵列芯片,通过编程可重新配置阵列的结构,以 满足不同算法的需求。例如美国普图(Purdue)大学的CHiP (Configurable Highly Parallel Computer),即可以不同算法构 造出相应的阵列机
CH护结构如图956所示,包含三个部分,即一组功能相同的处 理单元PE、一个控制器和一个开关网络。图中方框表示处理单元,圆圈 表示可编程开关,处理单元通过开关的转接实现互连。每一个开关含有 个局部存储器,称为开关存储器,存储构成不同阵列时的设置方式。 每种设置方式可使开关按一定的模式将相应的数据通路连接起来,以 实现各处理单元之间的不同拓扑结构。例如把偶数列上的开关设置成上 下连通,偶数行的开关左右连通,就可以构成如图9.6(a)所示的矩形 脉动阵列结构。按照特定的设置方式,也可构成如图9.6(b)所示的二 叉树阵列结构,其中灰色方框是根处理单元 2软件算法映象 软件算法映象是用软件的方法把不同的算法映象到固定的阵列结构 中,具有代表性的是美国卡内基梅隆大学研制的WARP计算机,主要 用于图像信号处理和计算机视觉方面。这种方法依赖于面向并行运算的 程序设计语言、操作系统、编译程序和软件开发工具
CHiP结构如图9.6 所示,包含三个部分,即一组功能相同的处 理单元PE、一个控制器和一个开关网络。图中方框表示处理单元,圆圈 表示可编程开关,处理单元通过开关的转接实现互连。每一个开关含有 一个局部存储器,称为开关存储器,存储构成不同阵列时的设置方式。 每一种设置方式可使开关按一定的模式将相应的数据通路连接起来,以 实现各处理单元之间的不同拓扑结构。例如把偶数列上的开关设置成上 下连通,偶数行的开关左右连通,就可以构成如图9.6(a)所示的矩形 脉动阵列结构。按照特定的设置方式,也可构成如图9.6(b)所示的二 叉树阵列结构,其中灰色方框是根处理单元。 2.软件算法映象 软件算法映象是用软件的方法把不同的算法映象到固定的阵列结构 中,具有代表性的是美国卡内基—梅隆大学研制的WARP计算机,主要 用于图像信号处理和计算机视觉方面。这种方法依赖于面向并行运算的 程序设计语言、操作系统、编译程序和软件开发工具
0000000O O口口O口Q口 O口O口口 口00口0 o909090o 00000000 (a)矩形阵列结构 (b)二叉树状阵列结构 图9.6可编程脉动阵列示意图
图9.6 可编程脉动阵列示意图
WARP是由10个以上的处理单元组成的维线性脉动阵列机如图9.7 所示。各处理单元有相同的内部结构,包含乘法器和浮点运算部件,有两 个数据队列κ秈和一个地址队列,且有自己的程序存储器和微操作控制器。 数据经κ圃通路传送,地址和脉动控空制信号经地址线路传送,在同一时刻 各个处理单元均进行相同的运算。 各处理单元按一定的方式连接,组成处理单元阵列,再通过接口部 件与主机连接,构成MARP脉动阵列机。主机负责阵列机与外部的数据信息 传送,经接口部件向处理单元阵列提供地址和控制信号;并且,执行部 分不适合脉动阵列处理的程序,为用户提供一个通用UNⅨX操作系统环境。 由于WARP机采用的是一维线性结构,因此易于实现和扩充;在内部 处理单元的程序存储器中裝有特定的微程序,且有内部数据存储器,可实 现多种运算,从而保证MARP机的通用性和灵活性。但是,一般需要专门的 高级语言和优化编译器
WARP是由10个以上的处理单元组成的一维线性脉动阵列机如图9.7 所示。各处理单元有相同的内部结构,包含乘法器和浮点运算部件,有两 个数据队列x、y和一个地址队列,且有自己的程序存储器和微操作控制器。 数据经x、y通路传送,地址和脉动控制信号经地址线路传送,在同一时刻, 各个处理单元均进行相同的运算。 各处理单元按一定的方式连接,组成处理单元阵列,再通过接口部 件与主机连接,构成WARP脉动阵列机。主机负责阵列机与外部的数据信息 传送,经接口部件向处理单元阵列提供地址和控制信号;并且,执行一部 分不适合脉动阵列处理的程序,为用户提供一个通用UNIX操作系统环境。 由于WARP机采用的是一维线性结构,因此易于实现和扩充;在内部 处理单元的程序存储器中装有特定的微程序,且有内部数据存储器,可实 现多种运算,从而保证WARP机的通用性和灵活性。但是,一般需要专门的 高级语言和优化编译器
x队列 寄存器算术逻 主机 A 辑部件 y队列 接口部件 存储器 寄存器乘法器 M 内部处理单元阵列 PEoPE PEn- 地址 地址队列 地址 —转换开关 (a)处理单元 (b)WARP处理机结构 图97WARP脉动阵列机
图9.7 WARP脉动阵列机