(SH4)DSP芯片的基本结构(3)专门的硬件乘法器和乘加指令MAC在数字信号处理的算法中,乘法和累加是基本的大量运算,占用绝大部分的处理时间。例如,数字滤波,卷积,相关,向量和矩阵运算中,有大量的乘和累加运算。PC机计算乘法需多个周期用软件实现,而DSP设置了硬件乘法器以及乘加指令MAC,在单周期内取两个操作数一次完成。Vre碧FEAOCOMP41RGBOUTGAGY(4)特殊的处理器指令RGB_OUT_RAEP3采用特殊的指令。RGBOUT_B例如:DMOV指令,把指令的数据复制到该地址加1的地址中原单元的内容不变----数据移位,相当于延迟。另一特殊指令LTD,在一个指令周期完成LT、DMOV和APAC三条指令的内容。DSP2026年3月7日11
DSP 2026年3月7日 11 (3)专门的硬件乘法器和乘加指令MAC 在数字信号处理的算法中,乘法和累加是基本的大量运算, 占用绝大部分的处理时间。 例如,数字滤波,卷积,相关,向量和矩阵运算中,有大量 的乘和累加运算。PC机计算乘法需多个周期用软件实现,而 DSP设置了硬件乘法器以及乘加指令MAC,在单周期内取两个 操作数一次完成。 (4)特殊的处理器指令 采用特殊的指令。 例如:DMOV指令,把指令的数据复制到该地址加1的地址中, 原单元的内容不变-数据移位,相当于延迟。 另一特殊指令LTD,在一个指令周期完成LT、DMOV和APAC 三条指令的内容。 DSP芯片的基本结构
(SH4)DSP芯片的基本结构当前辅助寄存器AR1=0200H,以此做为输入数据的基地址,顺序读入八个数即N=8,但按位反位序存放X(0)r(0)0WoNX(1)1(4)0WoNpX(2)r(2)0W?WoNNpX(3)r(6)0WoNGBOUTG6X(4)r(1)oRGBOUTRWWoRGBOLT_BNN6X(5)z(5)0W3woN6X(6)r(3)0W3W?WoBUCNNNX(7)r(7)0-1按时间抽取的8点FFT12DSP2026年3月7日
DSP 2026年3月7日 12 当前辅助寄存器AR1=0200H,以此做为输入数据的基地址,顺 序读入八个数即N=8,但按位反位序存放。 按时间抽取的8点FFT DSP芯片的基本结构
(SH4)DSP芯片的基本结构解开始对AR0赋值为N/2=4,执行以下两条程序即可:RPT#7PORTR *AR1+0 B. PA0CRRPT=7使得下一条指令重复执行八次:第二条为输入语句,从PA0口输入八个数据,即x(O),x(1),x(7),按照指定的间接寻址方式存放。间接地址AR1的内容,分别为:37VrerAR1=0200H初始值碧AR1FSADLCOMP41第1次变址AR1+AR0 = AR1=0204HRGBOUTGAGY63AP3RGB_OUT_R第2次变址AR1+AR0 = AR1=0202HABPhRGBOUT_B第3次变址AR1+AR0= AR1=0206H第4次变址AR1+AR0 = AR1=0201HBLANX第5次变址26OLXAR1+AR0 - AR1-0205HRB dUFC第6次变址AR1+AR0 = AR1=0203H第7次变址AR1+AR0-AR1-0207L2026年3月7日DSP13
DSP 2026年3月7日 13 解 开始对AR0赋值为N/2=4,执行以下两条程序即可: RPT #7 PORTR *AR1+0 B, PA0 RPT=7使得下一条指令重复执行八次; 第二条为输入语句,从PA0口输入八个数据,即x(0), x(1), , x(7), 按照指定的间接寻址方式存放。间接地址AR1的内容,分别 为: AR1 AR1=0200H 初始值 AR1+AR0 AR1=0204H 第1次变址 AR1+AR0 AR1=0202H 第2次变址 AR1+AR0 AR1=0206H 第3次变址 AR1+AR0 AR1=0201H 第4次变址 AR1+AR0 AR1=0205H 第5次变址 AR1+AR0 AR1=0203H 第6次变址 AR1+AR0 AR1=0207H 第7次变址 DSP芯片的基本结构
RC(SH4)DSP芯片的基本结构(5)高速的指令运行周期DSP指令周期可为几ns,LF2407A为40ns(6)丰富的片内存储器件和灵活的寻址方式片内集成FLASH和双口RAM,通过片内总线访问这些存储空间,因此不存在总线竞争和速度匹配问题,大大提高数据的读/写速度。(7)独立的直接存储器访问(DMA)总线及其控制器DSP为DMA单独设置了完全独立的总线和控制器RGBOUTGRGB_OUT_RA#PABPhRGBGUT_BSYNGBAY2EOLRGBGUFC2026年3月7日DSP12
DSP 2026年3月7日 14 (5) 高速的指令运行周期 DSP指令周期可为几ns,LF2407A为40ns 。 (6) 丰富的片内存储器件和灵活的寻址方式 片内集成FLASH和双口RAM,通过片内总线访问这些存 储空间,因此不存在总线竞争和速度匹配问题,大大提高数据 的读/写速度。 (7) 独立的直接存储器访问(DMA)总线及其控制器 DSP为DMA单独设置了完全独立的总线和控制器。 DSP芯片的基本结构
(SH4)单片机的区别。DSP与通用计算机数字信号处理的运算特点:乘/加,及反复相乘求和(乘积累加)早期的计算机或微处理器的内部乘法运算是靠加法器反复移位相加实现的,需要数十个时钟周期,ULVCTESA而DSP设置了硬件乘法/累加器,能在单个指令周期内完成乘加运算。为满足FFT、卷积等数字信号处理的特殊要求,目前DSP”寻址指令大多在指令系统中设置了“循环寻址“及“位倒序1R和其他特殊指令,使得寻址、排序的速度大大提高RGBOUT1024点复数FFT所需时间:微秒量级SANYOLSRGBGUFCDSP2026年3月7日15
DSP 2026年3月7日 15 DSP与通用计算机、单片机的区别 数字信号处理的运算特点:乘/加,及反复相乘求和(乘积累加) 早期的计算机或微处理器的内部乘法运算是靠加法器反复 移位相加实现的,需要数十个时钟周期。 而DSP设置了硬件乘法/累加器,能在单个指令周期内完成乘 /加运算。 为满足FFT、卷积等数字信号处理的特殊要求,目前DSP 大多在指令系统中设置了“循环寻址”及“位倒序”寻址指令 和其他特殊指令,使得寻址、排序的速度大大提高。 1024点复数FFT所需时间:微秒量级