1.1主要DSP芯片简介 1.1.1TI公司的DSP芯片 美国TI公司在1982年推出第一个DSP芯片。TI公司是1930年成立于 Te xas州的一家从事石油勘 探的公司,1951年改名为TI公司,经营重点转向电子技术。 TI公司发展了三种新的DSP系列,它们是TMS320C2000、TMS320C5000、TMS320C6000系列 成为当前TI公司DSP的主流产品 (1)TMS320C2000系列 TMS320C2000是做控制用的DSP,可以代替早期的TMS320C1X/C2X。 ①C20x:16位定点DsP,速度为20MIPS,主要用途是电话、数字相机、售货机等。其中C20x系 列的DSP片内的RAM一般都比较少,C204片内512B的 DARAM,但以F开头的DSP型号中都带 有闪速存储器( flash memory),F206带有32kx16bit的闪速存储器 ②C24xx:16位定点DSP,速度为20MIPS,用作数字马达控制、工业自动化、电力转换系统、空调 等。为了在空间有限的数字控制设备中实现更高档次的性能,TI公司目前推出三款新型24 XXDSP,分 别为TMS320LF2401A/LF2403A/LC2402A。这些新器件能使消费类和业界的原始设备生产商 (OEM)在降低系统成本同时,实现更加小型化、更具智能性和更加完善的产品设计 TI公司的可编程TMs320LF2401ADsP处理器,主要针对那些对节省空间和实时性能有严格要求的 设计应用。高层次的系统集成和业界体积最小的DsP处理器封装结合了LF2401A的优异性能和合理 价格,有助于OEM厂商更快地将控制产品推向市场。TI公司已经成功地把一个速度为40MIPS的 DsP内核、闪存以及一套控制优化的外围设备集成到体积最小的DSP处理器中,其封装尺寸不超过 个隐形眼镜片的尺寸。 除了LF2401A之外,TI公司还推出了其他两款新型DSP处理器,主要针对具有更大需求、空间受到 限制的应用。TMS320LF2403ADsP处理器能够提供16k×16bit闪存,具有代码保密、1kx 16 birAm、8个输入通道的10位ADC以及事件管理器、适合CAN2.0B协议的CAN总线控制器 sPI、21个GPIO,它们全部装入一只64脚10mmx10 mm TQFP封装中。而TMS320Lc2402ADSP 处理器与LF2403ADsP处理器引脚兼容,并能提供6k×16 b it Rom存储器替代闪存,以便降低大 批量生产的成本。所有这几种新器件都是基于TI公司业界领先的TMS320C2XDSP内核,从而使已 在高性能控制产品市场上地位稳固的 TI DSP系列产品,在应用范围和种类方面实现了进一步的拓展 (2)TMs320c5000系列 TMS320c5000系列是一种低功耗高性能的定点DSP,速度为30MIPs-800MIPS。主要用途是有线 和无线通信、IP、便携式信息系统、寻呼机、助听器等。 该系列主要有TMS320C54XX及其与其软件兼容的TMS320C55XX,后者功耗为前者的1/6,而综 合性能大约提高了5倍。这种新产品将促进数以千计对性能、尺寸、价格和功率预算有严格要求的应 用,例如未来一代的手持式和因特网多媒体设备。下面介绍两种值得关注的C5500系列芯片。 种是C5509。它是目前集成度很高的通用DsP,能实现新一代因特网多媒体娱乐终端、个人医疗 个人识别、保密技术、数码相机、个人摄像机或有这些应用任意组合的综合应用, C5509可以最广泛的支持任何DsP的板上外围器件,包括用于直接连接PC机或其他USB主机设备 的USB1.1端口。其无以伦比的功能集成可使设计者在设计电池供电产品和连接PC机产品时,将主 板空间和功率降低三倍,且支持大多数流行的可移动存储标准和多媒体格式。 c5509提供了一个完备的系统解决方案,具有96kx16bit的单口SRAM、32×16bit字的双口SRAM 32kκ16bit的RoM和6通道的DMA(直接存储器存储)。它还能提供外围器件设计需求的最广泛 选择,包括板上的USB1.1端口、用于全双工通信的三个多声道缓冲串行端口( MCBSP)、 Watchdog 定时器、具有32kHz频率的晶振信号输入和单电源的实时时钟、可实现电池监控和按钮接口的片上
1.1 主 要 DSP 芯片简介 1.1.1 TI 公司的 DSP 芯 片 美 国 TI 公司在 1982 年推出第一个 DSP 芯片。TI 公 司是 1930 年成立于 Te xas 州的一家从事石油勘 探的公司,1951 年改名为 TI 公司,经营重点转向电子技术。 TI 公司发展了三种新的 DSP 系 列 ,它 们 是 TMS320C2000、TMS320C5000、TMS320C6000 系列, 成为当前 TI 公 司 DSP 的主流产品。 ( 1) TMS320C2000 系 列 TMS320C2000 是做控制用的 DSP,可以代替早期的 TMS320C1X/C2X。 ① C20x: 16 位定点 DSP,速度为 20MIPS,主要用途是电话、数字相机、售货机等。其中 C20x 系 列 的 DSP 片内的 RAM 一般都比较少,C204 片内 512B 的 DARAM,但 以 F 开头的 DSP 型号中都带 有闪速存储器(flas h m emo ry) ,F206 带 有 32kⅹ 16bit 的闪速存储器。 ② C24xx:16 位 定点 DSP,速度为 20MIPS,用作数字马达控制、工业自动化、电力转换系统、空调 等 。为 了 在 空 间 有 限 的 数 字 控 制 设 备 中 实 现 更 高 档 次 的 性 能 ,TI 公司目前推出三款新型 24xxDSP,分 别 为 TMS320 LF2401A/LF2403A/LC2402A。这些新器件能使消费类和业界的原始设备生产商 ( OEM)在降低系统成本同时,实现更加小型化、更具智能性和更加完善的产品设计。 TI 公司的可编程 TMS320 LF2401A DSP 处 理 器 ,主 要 针 对 那 些 对 节 省 空 间 和 实 时 性 能 有 严 格 要 求 的 设 计 应 用 。高 层 次 的 系 统 集 成 和 业 界 体 积 最 小 的 DSP 处理器封装结合了 LF2401A 的优异性能和合理 价格,有助于 OEM 厂商更快地将控制产品推向市场。TI 公司已经成功地把一个速度为 40MIPS 的 DSP 内核、闪存以及一套控制优化的外围设备集成到体积最小的 DSP 处理器中,其封装尺寸不超过 一个隐形眼镜片的尺寸。 除 了 LF2401A 之外,TI 公司还推出了其他两款新型 DSP 处 理 器 ,主 要 针 对 具 有 更 大 需 求 、空 间 受 到 限制的应用。 TMS320 LF2403A DSP 处理器能够提供 16kⅹ 16bit 闪存,具有代码保密、1kⅹ 16bitRAM、8 个 输 入 通 道的 10 位 ADC 以及事件管理器、适合 CAN2.0B 协议的 CAN 总线控制器、 SPI、21 个 GPIO,它 们 全 部 装 入 一 只 64 脚 10mm ⅹ10mm TQFP 封 装 中 。而 TMS320LC2402A DSP 处理器与 LF2403A DSP 处理器引脚兼容,并能提供 6kⅹ 16bit ROM 存储器替代闪存,以便降低大 批量生产的成本。所有这几种新器件都是基于 TI 公司业界领先的 TMS320C2x DSP 内核,从而使已 在高性能控制产品市场上地位稳固的 TI DSP 系 列 产 品 ,在 应 用 范 围 和 种 类 方 面 实 现 了 进 一 步 的 拓 展 。 ( 2) TMS320C5000 系 列 TMS320C5000 系列是一种低功耗高性能的定点 DSP,速 度 为 30MIPS-800MIPS。主 要 用 途 是 有 线 和无线通信、 IP、便携式信息系统、寻呼机、助听器等。 该系列主要有 TMS320C54xx 及其与其软件兼容的 TMS320C55xx, 后者功耗为前者的 1/6,而综 合性能大约提高了 5 倍。这种新产品将促进数以千计对性能、尺寸、价格和功率预算有严格要求的应 用,例如未来一代的手持式和因特网多媒体设备。下面介绍两种值得关注的 C5500 系列芯片。 一种是 C5509。它是目前集成度很高的通用 DSP,能实现新一代因特网多媒体娱乐终端、个人医疗、 个人识别、保密技术、数码相机、个人摄像机或有这些应用任意组合的综合应用。 C5509 可以最广泛的支持任何 DSP 的板上外围器件,包括用于直接连接 PC 机或其他 USB 主机设备 的 USB1.1 端 口 。其 无 以 伦 比 的 功 能 集 成 可 使 设 计者在设计电池供电产品和连接 PC 机 产 品 时 ,将 主 板空间和功率降低三倍,且支持大多数流行的可移动存储标准和多媒体格式。 C5509 提 供 了 一 个 完 备 的 系 统 解 决 方 案 ,具 有 96kⅹ 16bit 的 单口 SRAM、32ⅹ 16bit 字的双口 SRAM、 32kⅹ 16bit 的 ROM 和 6 通道的 DMA(直接存储器存储)。它还能提供外围器件设计需求的最广泛 选 择 ,包 括 板 上 的 USB1.1 端 口 、用 于 全 双 工 通 信 的 三 个 多 声 道 缓 冲 串 行 端 口( MCBSP)、Wat chdo g 定时器、具有 32kHz 频率的晶振信号输入和单电源的实时时钟、可实现电池监控和按钮接口的片上
1 obit ADO、连接为控制器的I2C通道接口,以及用于芯片内通信的编解码器、支持外部传输的6通 道DMA、 SDRAM、 SBSRAM和异步增强型存储器接口、增强型16bⅰt主机端口接口、两个16bit通 用定时器、内存条接口和MMC/ SDDENG等 C5509支持大多数流行的存储形式,包括记忆棒、多媒体卡(MMC)和SD( secure digital)卡 对于未来的手持式多媒体应用,TI公司的庞大的第三方网络提供了大量现成的算法,包括MPEG4 jPEG视频编码和解码、MP3、WMA、其他音频编码和解码、语音识别、文本语音转换和生物统计学 另一种是C5502。它作为TI公司TMS320C5000DSP平台上新型的性能/价格比最佳的产品,可满 足当今个人系统对价格和功率预算的要求,可实现每秒执行4亿次指令。C5502能提供400MB/s的 全32位外部存储接口,并支持低价 SDRAM。它具有32kx16bit的片上双口随机存储器、一个主机 端口接口、通用外围设备(如3个多通道缓冲串行端口)1个硬件UART,I2C主/从站端口接口和 76针专用和复用GPIO。 TMS320c55XX是TI公司DSP产品TMS320C5000系列最新的一种。它极大地降低了功耗,每个 MIPS只需0.05mW。由于TMS320C5000系列具有可编程、低功耗特性,全世界有70%的移动 电话使用这一系列的元件,而TMS320C55X则通过其强大的电源管理功能使省电特性进一步增强。 例如,TMS320C55ⅹ可使网络音频播放器用两节AA电池工作200h,是目前播放器的工作时间的10 倍:而且它还可以支持所有的因特网音频标准。芯片中的可编程内核与主流TMS320C54Xx软件相兼 容 (3)TMs320C6000系列 这是TI公司1997年2月推向市场的高性能DSP,它综合了目前DSP的所有优点,具有最佳的性价 比和低功耗。C6000系列中又分成定点和浮点两类 ①c62XX16位定点DSP,速度为1200MIPs-2000MIPS,用于无线基站、ADSL、 Moden、网络 系统、中心局交换机、数字音频广播设备等,价格为21-224美元 ②C67xx32位浮点DSP,速度为1 GFLOPS,用于基站数字波束形成、医学图像处理、语音识别 3D图形等,价格109-233美元 c6000在向两个方向发展,一是追求更高的性能:二是在保持高性能的同时向廉价型发展。前者如定 点C6202可以达到2000MIPs的速度,后者如定点C6211(只有25美元)、浮点的C6711 TI公司的三款最新器件TMS320C6414、TMS320c6415和TMS320c6416,其性能大为提高,工 作频率达到600MHz,计算速度接近每秒50亿次指令,而功耗仅为现有器件的三分之一。它们可通 过一条单独接入家庭的宽带线路传输大量的个性化数据、视频和语音,可通过第三代无线基站向无线 手机发送多媒体信息。 目前先进的C64X,除了在时钟上的提高外,在内部结构上也进行了新的优化,体现在以下方面 ①在C62X的基础上寄存器增大了一倍,从原来的16个变成了32个 ②对于乘法器、累加器、桶式卷积和运算器等特殊硬件运算器,数量比原来增加了1到3倍 ③CPU通过L1 Program Cache和L1 Data cac he执行指令和数据处理,并通过L2 Cache与EDMA enhanced dma controller)相连,控制外围设备,使得 Cache空间增大了。 ④外部总线变成了64bit,是C62X的2倍 ⑤在数据结构上支持8bit的运算操作。由于在图像应用中大量的数据流是8bit的,所以C64x能大 大提高图像处理的速度。如果内部有4个乘法器,就可以在一个时钟周期中连续执行8次乘法运算 ⑥在指令上也做了些优化,夹了不少新的指令集 1.1.2DSP的应用 DsP芯片高速发展,一方面得益于集成电路的发展,另一方面也得益于巨大的市场。经过二十余年 的发展,DSP应用领域日渐宽广,DSP芯片已经在信号处理、通信、雷达等许多领域得到广泛的应用。 目前,DsP芯片的价格也越来越低,性能价格比日益提高,具有巨大的应用潜力。DSP芯片的应用主
10bit ADC、连接为控制器的 I2C 通 道 接 口, 以 及 用 于 芯 片 内 通 信 的 编 解 码 器 、 支 持 外 部 传 输 的 6 通 道 DMA、SDRAM、S BSRAM 和异步增强型存储器接口、增强型 16bit 主 机 端 口 接 口 、两个 16bit 通 用定时器、内存条接口和 MMC/SDDENG 等 。 C5509 支持大多数流行的存储形式,包括记忆棒、多媒体卡(MMC) 和 SD( s e c ure digital)卡。 对于未来的手持式多媒体应用,TI 公司的庞大的第三方网络提供了大量现成的算法,包括 MPEG4 和 JPEG 视频编码和解码、MP3、 WMA、其他音频编码和解码、语音识别、文本语音转换和生物统计学 等 。 另一种是 C5502。它作为 TI 公司 TMS320C5000 DSP 平台上新型的性能/价格比最佳的产品,可满 足当今个人系统对价格和功率预算的要求,可实现每秒执行 4 亿 次 指 令。C5502 能 提供 400MB/s 的 全 32 位外部存储接口,并支持低价 SDRAM。它 具 有 32kⅹ 16bit 的片上双口随机存储器、一个主机 端口接口、通用外围设备(如 3 个多通道缓冲串行端口)1 个硬件 UART,I2C 主 /从站端口接口和 76 针专用和复用 GPIO。 TMS320C55xx 是 TI 公 司 DSP 产 品 TMS320C5000 系列最新的一种。它极大地降低了功耗,每个 MIPS 只 需 0. 05m W。由于 TMS320C5000 系列具有可编程、低功耗特性,全世界有 70%的移动 电话使用这一系列的元件,而 TMS320C55x 则通过其强大的电源管理功能使省电特性进一步增强。 例如,TMS320C55x 可使网络音频播放器用两节 AA 电 池 工作 200h,是 目 前 播 放 器 的 工 作 时 间的 10 倍 ;而 且 它 还 可 以 支 持 所 有 的 因 特 网 音 频 标 准 。芯 片 中 的 可 编 程 内 核 与 主 流 TMS320C54xx 软件相兼 容 。 ( 3) TMS320C6000 系 列 这 是 TI 公 司 1997 年 2 月 推 向 市 场 的 高 性能 DSP,它 综 合 了 目 前 DSP 的 所 有 优 点 ,具 有 最 佳 的 性 价 比和低功耗。 C6000 系列中又分成定点和浮点两类。 ① C62xx 16 位定点 DSP,速度为 1200MIPS-2000MIPS,用于无线基站、ADSL、 Mo d em、网络 系统、中心局交换机、数字音频广播设备等,价格为 21-224 美元。 ② C67xx 32 位浮点 DSP,速度为 1GFLOPS,用于基站数字波束形成、医学图像处理、语音识别、 3D 图形等,价格 109-233 美元。 C6000 在向两个方向发展,一是追求更高的性能;二是在保持高性能的同时向廉价型 发 展 。前 者 如 定 点 C6202 可以达到 2000MIPS 的速度,后者如定点 C6211(只有 25 美元)、浮点的 C6711。 TI 公司的三款最新器件 TMS320C6414、TMS320C6415 和 TMS320C6416,其性能大为提高,工 作频率达到 600MHz,计算速度接近每秒 50 亿次指令,而功耗仅为现有器件的三分之一。它们可通 过一条单独接入家庭的宽带线路传输大量的个性化数据、视频和语音,可通过第三代无线基站向无线 手机发送多媒体信息。 目前先进的 C64x,除了在时钟上的提高外,在内部结构上也进行了新的优化,体现在以下方面: ① 在 C62x 的基础上寄存器增大了一倍,从原来的 16 个变成了 32 个 。 ② 对于乘法器、累加器、桶式卷积和运算器等特殊硬件运算器,数量比原来增加了 1 到 3 倍 。 ③ CPU 通 过 L1 Pro g ram Cac he 和 L1 Data Cac he 执 行 指 令 和 数 据 处 理 ,并 通 过 L2 Cac he 与 EDMA ( e nhan c e d DMA c o n tro lle r)相连,控制外围设备,使得 Cac he 空间增大了。 ④ 外部总线变成了 64bit, 是 C62x 的 2 倍 。 ⑤ 在数据结构上支持 8bit 的运算操作。由于在图像应用中大量的数据流是 8bit 的 ,所 以 C64x 能 大 大提高图像处理的速度。如果内部有 4 个乘法器,就可以在一个时钟周期中连续执行 8 次乘法运算。 ⑥ 在指令上也做了些优化,夹了不少新的指令集。 1.1.2 DSP 的应用 DSP 芯 片 高 速 发 展 ,一 方 面 得 益 于 集 成 电 路 的 发 展 ,另 一 方 面 也 得 益 于 巨 大 的 市 场 。经 过 二 十 余 年 的发展,DSP 应用领域日渐宽广,DSP 芯 片 已 经 在 信 号 处 理 、通 信 、雷 达 等 许 多 领 域 得 到 广 泛 的 应 用 。 目前,DSP 芯片的价格也越来越低,性能价格比日益提高,具有巨大的应用潜力。DSP 芯片的应用主
要有以下9个方面。 ①经典信号处理:数字滤波、自适应滤波、快速傅立叶变换、相关运算、频谱分析、卷积等, ②现代信号处理:AR、ARMA、卡尔曼滤波、小波分析等 ③语音处理:语音编码、语音合成、语音识别、语音增强、语音邮件、语音储存等。 ④图像/图形:二维和三维图形处理、图像压缩与传输、图像识别、动画、机器人视觉、多媒体 电子地图、图像增强等 ⑤军事:保密通信、雷达处理、声纳处理、导航、全球定位、跳频电台、搜索和反搜索等。 ⑥仪器仪表:频谱分析、函数发生、数据采集、地震处理等。 ⑦自动控制:控制、深空作业、自动驾驶、机器人控制、磁盘控制等。 ⑧医疗:助听、超声设备、诊断工具、病人监护、心电图等 ⑨家用电器:数字音响、数字电视、可视电话、音乐合成、音调控制、玩具与游戏等。 近年来,DSP更是普遍应用在下列热门产品中 (1)通信电子类( communication e lectro n ics):蜂窝电话( ce llular pho ne)、 ADSL调制解调器 ( modem)、线缆调制解调器( cable modem)、蓝牙技术( bluetooth)产品、数字电话应答机 ( digital te le phone answering de vice)、全球定位系统( Global positioning Syste,GPS 卫星电话( satellite phone)电话会议( co nfe rence s pe a ke rp hone)、ATM电话( voice over atm) 智能天线( smart antenna)、PCS用户端( subscriber set)。其中DSP在通信领域的应用大约 占DsP市场份额的60%。(2)计算机类( computer electronics):计算机电话卡( Computer Telephone board,CTB)硬盘驱动器( hard disk d river)、 DDPRML读取通道( read channel)、 PCI声卡芯片( audio/ sound chip)、声卡( soundboard) (2)消费电子类( consumer e le ctron ics):数字多用光盘( Dig ital Ve rs tile Disk,DVD)、数字 电视( digital∨)、数字助听器( digital hearing aid)、数字相机芯片( digital camera chip) 机顶盒( set top box) 3)仪器电子类( instrumentation electron ics):马达控制芯片( motor control chip) (4军事电子类( military electronics):雷达系统( radar sys tem)、声纳系统( sonar system)。 (5)办公自动化设备( office autom ation electronics)以及数字无线电广播( Dig ital Radio Broadcasting,DRB)等 1.2DSP芯片结构 DSP芯片结构:中央处理单元(CPU)、存储器、片内外与专用硬件电路三个组成部分 1.2.1中央处理单元 包括:算术逻辑单元、累加器、输入定标移位器、乘法器、输出数据定标移位器 1、中央算术逻辑单元(CALU) 实现大部分算术和逻辑运算功能,功能包括:16位加、16位减、布逻辑操作、位测试、移位循环功 能:而且大部分运算只需要一个时钟周期。 由于CALU具有布尔运算功能,因此该控制器具有位操作功能。CALU的位移动和循环在累加器内完 成:当CALU执行完亠次操作后将结果送至32位累加器由累加器对其结果进行移位,累加器的输出 送到32位输出数据定标移位器,经过输出数据定标移位器,累加器的高、低16位字分别被移位或存 入数据寄存器。 CALU溢出饱和方式可以由ST0的oVM位来使能或禁止。当CALU处于溢出模式时,如果溢出发生 了,则溢出标志位被置位,并且累加器根据溢出方向被载入一个最大的或一个最小的负值。对于绝大 多数指令,状态寄存器ST1的符号扩展位SXM决定了在CALU计算时是否使用符号扩展:若SXM=0 符号扩展无效:若SXM=1,符号扩展有效。 2、累加器 它的功能就是存CALU的操作结果,并对其进行单位移位或循环移位,同时将结果输出到CALU或输
要有以下 9 个方面。 ①经典信号处理:数字滤波、自适应滤波、快速傅立叶变换、相关运算、频谱分析、卷积等。 ②现代信号处理:AR、ARMA、卡尔曼滤波、小波分析等。 ③语音处理:语音编码、语音合成、语音识别、语音增强、语音邮件、语音储存等。 ④ 图 像 /图形:二维和三维图形处理、图像压缩与传输、图像识别、动画、机器人视觉、多媒体、 电子地图、图像增强等。 ⑤军事:保密通信、雷达处理、声纳处理、导航、全球定位、跳频电台、搜索和反搜索等。 ⑥仪器仪表:频谱分析、函数发生、数据采集、地震处理等。 ⑦自动控制:控制、深空作业、自动驾驶、机器人控制、磁盘控制等。 ⑧医疗:助听、超声设备、诊断工具、病人监护、心电图等。 ⑨家用电器:数字音响、数字电视、可视电话、音乐合成、音调控制、玩具与游戏等。 近年来,DSP 更是普遍应用在下列热门产品中。 ⑴ 通信电子类(c ommunic atio n e lectro nics ):蜂窝电话(ce llular pho ne ) 、 ADSL 调制解调器 ( m o d em)、线缆调制解调器(c able m o dem)、蓝牙技术(bluetooth)产品、数字电话应答机 ( digital te le phone an swe ring de vice )、全球定位系统(Glob al Po s itio ning Sys tem ,GPS) 、 卫星电话 (s ate llite pho ne )、电 话 会 议(co n fe renc e s pe ake rpho ne)、ATM 电 话( vo ice o ve r ATM)、 智能天线(sm art an te nna) 、 PCS 用户端(s ub sc ribe r s e t)。其中 DSP 在通信领域的应用大约 占 DSP 市场份额的 60%。 ⑵计算机类(c ompu ter e le c tronics):计算机电话卡(Compu ter Te lepho ne Bo ard ,CTB)硬 盘 驱 动 器( hard dis k d rive r)、D DPRML 读 取 通 道( re ad c hanne l)、 PCI 声卡芯片(audio /s o und c hip)、声卡(s ound bo ard) 。 ⑵ 消费电子类(c ons ume r e le ctronics ):数字多用光盘(Digital Ve rs atile Dis k, DVD)、数字 电视( digital TV)、数字助听器(digital he aring aid)、数字相机芯片(digital c am e ra chip) 、 机顶盒( s e t to p b o x) 。 ⑶ 仪器电子类(in s trum en tation e le c tronics ):马达控制芯片(mo to r c o n trol c hip) 。 ⑷ 军 事 电 子 类(m ilitary e le ctronics ):雷 达 系 统( rad ar s ys tem )、声 纳 系 统(so nar s ystem )。 (5)办公自动化设备(o ffic e au tom atio n e le c tronics)以及数字无线电广播(Digital Radio Bro ad c as ting, DRB)等。 1.2 DSP 芯片结构 DSP 芯片结构:中央处理单元(CPU)、存储器、片内外与专用硬件电路三个组成部分。 1 .2 .1 中央处理单元 包括:算术逻辑单元、累加器、输入定标移位器、乘法器、输出数据定标移位器 1、中央算术逻辑单元(CALU) 实现大部分算术和逻辑运算功能,功能包括:16 位加、 16 位减、布逻辑操作、位测试、移位循环功 能 ;而且大部分运算只需要一个时钟周期。 由 于 CALU 具 有 布 尔 运 算 功 能 ,因 此 该 控 制 器 具 有 位 操 作 功 能 。CALU 的位移动和循环在累加器内完 成 :当 CALU 执行完一次操作后将结果送至 32 位 累 加 器 由 累 加 器 对 其 结 果 进 行 移 位 ,累 加 器 的 输 出 送 到 32 位 输 出 数 据 定 标 移 位 器 ,经 过 输 出 数 据 定 标 移 位 器 ,累 加 器 的 高 、低 16 位字分别被移位或存 入数据寄存器。 CALU 溢出饱和方式可以由 ST0 的 OVM 位来使能或禁止。当 CALU 处于溢出模式时,如果溢出发生 了,则溢出标志位被置位,并且累加器根据溢出方向被载入一个最大的或一个最小的负值。对于绝大 多 数 指 令 ,状 态 寄 存 器 ST1 的符号扩展位 SXM 决定了在 CALU 计 算 时 是 否 使 用 符 号 扩 展 :若 SXM=0, 符号扩展无效;若 SXM=1,符号扩展有效。 2、累加器 它的功能就是存 CALU 的操作结果,并对其进行单位移位或循环移位,同时将结果输出到 CALU 或 输
出数据定标移位器。与累加器相关联的状态位有溢出方式位、溢出标志位、进位位和测试控制标志位。 进位标志位C当加到累加器或从累加器减或将累加器数值移1位或循环移1位时将影响进位标志位 溢出方式位(OⅤM)。OⅤM决定累加器如何处理算术运算的溢出,当OVM=1且有溢出发生时,累 加器自动填充最大值(7 FFF FFFF)或最小值(80000000):当OVM=0时,累加器中的结果正常输出 溢出标志位(ov)。当未检测到累加器溢出时,oⅴ未被锁存,其值为0:当溢出发生时,O位被置 为1,而且被锁存 测试控制标志位(TC)。根据被测试位的结果,该位置为0或1 3、输入定标移位器 输入定标移位器的功能是将来自程序存储器或数据存储器的16位数据调整为32位数据送到CALU 因此16位输入与数据总线相连,32位输出与CALU单元相连。输入定标移位器作为从程序/数据存 储空间到CALU间数据传输路径一部分,并不会占用额外的时钟开销。 移位方法是:均使用左移,左移后,没有使用的低位LSB填0,没有使用的高位MSB填0或用符号 扩展,这取决于状态寄存器ST1的符号扩展模式位SXM。当SXM=1时,则高位进行符号扩展:当 SXM=0时,则高位填0。该移位器在算术定标以及逻辑操作时非常有用 4、乘法器 DSP采用一个16乘16位的硬件乘法器,可以在单个机器周期内产生一个32位的有符号或无符号乘 积结果。乘法器将来自16位数据存储器(程序存储器)的值与16位TREG寄存器的值乘积,结果送 到32位乘积寄存器中。乘积移位器将PREG中的乘积移位后,将全部32位送到CALU,或将结果的 16位存到数据存储器。移位模式取决于状态寄存器ST1中的乘积移位模式PM位, PM移位作用 00没有移位乘积送到CALU或者数据写总线,不移位 01左移1位移去二进制补码乘法产生的额外符号位,产生Q31格式的乘积 10左移4位移去16位乘13位二进制补码乘法产生额外4位符号位,产生Q31格式的乘积 11右移6位将乘积右移6位,使最多做128次乘累加而不使累加器溢出。无论ST1中的SXM为何 值,右移总是进行符号扩展 5、DsP状态和控制寄存器 芯片有两个状态寄存器:状态寄存器ST0和ST1。ST0和ST1包含各种条件和模式的状态。 (1)ST0 sT0寄存器的定义如表 比持域15-1312111098-0 名称 ARP OV OVM1 INTM DP 复位值Ⅹ0X11X ARP域:辅助寄存器指针。在间接寻址模式中用于选择当前辅助寄存器,当ARP被装载时,原先的 ARP被复制到ARB中 O∨位:溢出标志位,当中央算术逻辑单元发生溢出时,O∨=1。一旦发生溢出,O保持1状态,直 到发生复位、或执行以O√或NO为条件的条件跳转指令、或执行LST指令时被清0。 oVM位:溢出模式位。OVM决定当CALU发生溢出时的处理方式。OVM=0,累加器结果正常溢出 OVM=1,当上溢时,将最大的正数7 FFFFFFFH加载到累加器,当下溢时将最大的负数80000000H 加载到累加器。SETC、CLRC、LST等指令可修改OVM。 INTM位:中断模式位。INTM可全局屏蔽中断。INTM=0时,使能所有可屏蔽中断:INTM=1时 禁止所有的可屏蔽中断。复位或可屏蔽中断发生时,INTM置1,禁止中断。INTM不影响不可屏蔽中 断RS、NMI及软中断。LST指令不影响INTM。LST#0,DMA DP:数据存储器页指针。DP的9位和指令字中的低7位连接在一起,形成直接寻址中的16位数据 存储单元地址
出 数 据 定 标 移 位 器 。与 累 加 器 相 关 联 的 状 态 位 有 溢 出 方 式 位 、溢 出 标 志 位 、进 位 位 和 测 试 控 制 标 志 位 。 进位标志位 C。当 加 到 累 加 器 或 从 累 加 器 减 或 将 累 加 器 数 值 移 1 位 或 循 环 移 1 位时将影响进位标志位; 溢出方式位( OVM) 。 OVM 决定累加器如何处理算术运算的溢出,当 OVM=1 且有溢出发生时,累 加器自动填充最大值(7FFF FFFF)或最小值(8000 0000);当 OVM=0 时 ,累 加 器 中 的 结 果 正 常 输 出 。 溢 出 标 志 位( OV)。当 未 检 测 到 累 加 器 溢 出 时 ,OV 未 被 锁 存 ,其 值 为 0;当 溢 出 发 生 时 ,OV 位被置 为 1,而且被锁存。 测试控制标志位(TC)。根据被测试位的结果,该位置为 0 或 1 . 3、输入定标移位器 输入定标移位器的功能 是将来自程序存储器或数据存储器的 16 位数据调整为 32 位数据送到 CALU, 因 此 16 位输入与数据总线相连,32 位输出与 CALU 单元相连。输入定标移位器作为从程序/数据存 储空间到 CALU 间数据传输路径一部分,并不会占用额外的时钟开销。 移位方法是:均使用左移,左移后,没有使用的低位 LSB 填 0,没有使用的高位 MSB 填 0 或 用 符号 扩展,这取决于状态寄存器 ST1 的符号扩展模式位 SXM。 当 SXM=1 时,则高位进行符号扩展; 当 SXM=0 时,则高位填 0。该移位器在算术定标以及逻辑操作时非常有用。 4、乘法器 DSP 采用一个 16 乘 16 位 的 硬 件 乘 法 器 ,可 以 在 单 个 机 器 周 期 内 产 生 一 个 32 位的有符号或无符号乘 积 结 果 。乘 法 器 将 来 自 16 位 数 据 存 储 器( 程 序 存 储 器 )的 值 与 16 位 TREG 寄 存 器 的 值 乘 积 ,结 果 送 到 32 位乘积寄存器中。乘积移位器将 PREG 中的乘积移位后,将全部 32 位送到 CALU,或 将 结 果 的 16 位存到数据存储器。移位模式取决于状态寄存器 ST1 中的乘积移位模式 PM 位 , PM 移 位 作 用 00 没有移位 乘积送到 CALU 或者数据写总线,不移位 01 左 移 1 位 移去二进制补码乘法产生的额外符号位,产生 Q31 格式的乘积 10 左 移 4 位 移 去 16 位 乘 13 位二进制补码乘法产生额外 4 位符号位,产生 Q31 格式的乘积 11 右 移 6 位 将乘积右移 6 位 ,使 最 多做 128 次 乘 累 加 而 不 使 累 加 器 溢 出 。无论 ST1 中 的 SXM 为 何 值,右移总是进行符号扩展 5、DSP 状态和控制寄存器 芯片有两个状态寄存器:状态寄存器 ST0 和 ST1。 ST0 和 ST1 包含各种条件和模式的状态。 (1) ST0 ST0 寄存器的定义如表 比持域 15-13 12 11 10 9 8-0 名 称 ARP OV OVM 1 INTM DP 复位值 X 0 X 1 1 X ARP 域:辅助寄存器指针。在间接寻址模式中用于选择当前辅助寄存器,当 ARP 被装载时,原先的 ARP 被复制到 ARB 中 。 OV 位:溢出标志位,当中央算术逻辑单元发生溢出时,OV=1。一旦发生溢出,OV 保 持 1 状态,直 到发生复位、或执行以 OV 或 NOV 为条件的条件跳转指令、或执行 LST 指令时被清 0。 OVM 位:溢出模式位。OVM 决定当 CALU 发生溢出时的处理方式。OVM=0,累加器结果正常溢出; OVM=1,当 上 溢 时 ,将 最 大 的 正 数 7FFFFFFFH 加载 到 累 加 器 ,当 下 溢 时 将 最 大 的 负 数 80000000H 加载到累加器。SETC、CLRC、 LST 等指令可修改 OVM。 INTM 位:中断模式位。INTM 可全局屏蔽中断。INTM=0 时,使能所有可屏蔽中断;INTM=1 时 , 禁止所有的可屏蔽中断。复位或可屏蔽中断发生时,INTM 置 1,禁 止 中 断 。INTM 不影响不可屏蔽中 断 RS、NMI 及软中断。LST 指令不影响 INTM。LST #0, DMA DP:数据存储器页指针。DP 的 9 位和指令字中的低 7 位连接在一起,形成直接寻址中的 16 位数据 存储单元地址
(2)ST1 ST1寄存器的定义如表 15-13121110987654321~0 ARB CNF TC SXM C 1111 XF 11 PM ARB,辅助寄存器指针缓冲器。当ARP被装载时,原先的ARP值被复制到ARB中。当LST指令装载 ARB时,相同的值也复制到ARP中 CNF位,片内 DARAM配置位。CNF=0,可配置的 DARAM映射到数据存储区,CNF=1,可 配置的 DARAM映射到程序存储区 TC位,测试/控制标志位。存储算术逻辑单元测试位操作的结果。在下列情况下,TC=1,用BIT或 BITT指令测试的某位为1:或用CMPR指令对当前辅助寄存器与AR0比较条件成立:或用NORM指 令对累加器最高的两位进行异或结果为真条件跳转、调用、返回指令可基于TC位的条件执行。BIT、 BITT、CMPR、LST、NORM等指令影响TC位 SXM位,符号扩展模式位。SXM决定是否进行扩展。SXM=0,禁止符号扩展:SⅩM=1,数据被ALU 使用之前进行符号扩展。SXM不影响某些指令,不管SXM为何值,ADDS和SUB指令时禁止符号扩 展。LST#1对SXM位进行加载,复位时SXM被置1 C位,进位位。加法运算产生进位时置1,减法运算产生借位时清0。除非执行带16位移位的ADD 和sUB指令,否则,加法运算没有进位时清0,减法运算没有借位时置1:移1位和循环指令也可影 响进位位C,以及SETC,CLRC,和LST指令也可影响C:条件转移、调用和返回指令可以根据C 的状态执行。复位时C是被置1。 XF位:XF状态位。指示XF引脚的状态。SETC指令可将XF置1,CLRC指令可将XF置0。由于改 变这一位的状态将改变XF引脚的电平,因此读者需要注意,如果需要在中断程序中设置XF的话,那 么在中断入口处对ST1寄存器的保护时需要对XF位进行特殊的处理 (3)辅助寄存器算术单元 该算术单元完全独立于中央算术逻辑单元。ARAU主要功能是在CALU操作的同时执行8个辅助寄存 器(ARO~AR7)中的算术运算 辅助寄存器提供了灵活而强大的间接寻址功能,使用其中任意一个寄存器提供的16位地址可以访问 64K字数据储存空间的任何单元。选择特定辅助寄存器,用指令把0~7写入辅助寄存器指针ARP(ST0 中)中,此时ARP所指的寄存器为当前辅助寄存器。当处理一条指令时,当前AR的内容用做访问数 据存储器的地址 1.2.2存储器及I/O空间 芯片具有192K字的可寻址存储器空间:64K字程序空间、64K字数据空间和64K字的I/O空间 它的设计以改进的哈佛结构为基础,存储空间由3组16位并行总线访问:程序地址总线(PAB)、 数据读地址总线(DRAB)、数据写地址总线(DWAB) (1) DARAM:分为三块,B0、B1、B2。在 DARAM中,允许CPU在一个周期内对其进行读和写。 B0块:根据CNF位决定该块配置为数据存储空间还是程序存储空间。 (2) SARAM:每一个 SARAM块在一个机器周期只能被访问一次:可映射为数据存储空间或程序存 储空间。 (3) FLASH:片上 FLASH被映射到程序存储空间。对于外部存储器扩展接口芯片复位时根据MP/MC 引脚决定是从片内还是片外执 1.2.3系统控制寄存器和中断向量 1.系统控制寄存器 (1)系统控制和状态寄存器1(sCsR1)-地址7018H 位15保留位 位14 CLKSRO。 CLKOUT引脚源选择位
(2) ST1 ST1 寄 存 器的定义如表 15-13 12 11 10 9 8 7 6 5 4 3 2 1~0 ARB CNF TC SXM C 1 1 1 1 XF 1 1 PM ARB,辅 助 寄 存 器 指 针 缓 冲 器 。当 ARP 被 装 载 时 ,原 先 的 A RP 值被复制到 ARB 中 。当 LST 指令装载 ARB 时,相同的值也复制到 ARP 中 。 CNF 位,片内 DARAM 配置位。CNF=0,可配置的 DARAM 映射到数据存储区,CNF=1, 可 配置的 DARAM 映射到程序存储区。 TC 位,测试/控制标志位。存储算术逻辑单元测试位操作的结果。在下列情况下,TC=1, 用 BIT 或 BITT 指令测试的某位为 1;或 用 CMPR 指令对当前辅助寄存器与 AR0 比 较 条 件 成 立 ;或 用 NORM 指 令对累加器最高的两位进行异或结果为真条件跳转、调用、返回指令可基于 TC 位的条件执行。BIT、 BITT、CMPR、 LST、 NORM 等指令影响 TC 位 。 SXM 位 ,符 号 扩 展 模 式 位 。SXM 决定是否进行扩展。SXM=0,禁 止 符 号 扩 展 ;S XM=1,数 据 被 ALU 使用之前进行符号扩展。SXM 不 影 响 某 些 指 令 ,不 管 SXM 为何值,ADDS 和 SUB 指令时禁止符号扩 展 。 LST #1 对 SXM 位进行加载,复位时 SXM 被 置 1。 C 位,进位位。加法运算产生进位时置 1,减法运算产生借位时清 0。除非执行带 16 位移位的 ADD 和 SUB 指 令 ,否 则 ,加 法 运 算 没 有 进 位 时 清 0,减 法 运 算 没 有 借 位 时置 1;移 1 位和循环指令也可影 响进位位 C,以及 SETC, CLRC, 和 LST 指令也可影响 C;条件转移、调用和返回指令可以根据 C 的状态执行。复位时 C 是被置 1。 XF 位 :XF 状 态 位 。指 示 XF 引脚的状态。SETC 指令可将 XF 置 1,CLRC 指令可将 XF 置 0。由 于 改 变这一位的状态将改变 XF 引 脚 的 电 平 ,因 此 读 者 需 要 注 意 ,如 果 需 要 在 中 断 程 序 中 设 置 XF 的 话 ,那 么在中断入口处对 ST1 寄存器的保护时需要对 XF 位进行特殊的处理。 ( 3)辅助寄存器算术单元 该算术单元完全独立于中央算术逻辑单元。ARAU 主要功能是在 CALU 操作的同时执行 8 个辅助寄存 器 ( AR0~AR7)中的算术运算。 辅助寄存器提供了灵活而强大的间接寻址功能,使用其中任意一个寄存器提供的 16 位地址可以访问 64K 字 数 据 储 存 空 间 的 任 何 单 元 。选 择 特 定 辅 助 寄 存 器 ,用 指 令 把 0~7 写入辅助寄存器指针 ARP(ST0 中)中,此时 ARP 所指的寄存器为当前辅助寄存器。当处理一条指令时,当前 AR 的内容用做访问数 据存储器的地址。 1 .2 .2 存储器及 I/O 空 间 芯片具有 192K 字的可寻址存储器空间:64K 字程序空间、 64K 字数据空间和 64K 字 的 I/O 空间。 它的设计以改进的哈佛结构为基础,存储空间由 3 组 16 位并行总线访问:程序地址总线(PAB) 、 数据读地址总线(DRAB)、数据写地址总线(DWAB) 。 ( 1) DARAM:分为三块,B0、 B1、B2。 在 DARAM 中,允许 CPU 在一个周期内对其进行读和写。 B0 块:根据 CNF 位决定该块配置为数据存储空间还是程序存储空间。 ( 2) SARAM:每一个 SARAM 块在一个机器周期只能被访问一次;可映射为数据存储空间或程序存 储 空间。 ( 3)FLASH:片 上 FLASH 被 映 射 到 程 序 存 储 空 间 。对 于 外 部 存 储 器 扩 展 接 口 芯 片 复 位 时 根据 MP/MC 引脚决定是从片内还是片外执行。 1 .2 .3 系统控制寄存器和中断向量 1 . 系统控制寄存器 ( 1)系统控制和状态寄存器 1( SCSR1) -地 址 7018H 位 15 保留位 位 14 CLKSRC。 CLKOUT 引脚源选择位