基于 TMS320C6200 系列 DSP 芯片的应用与开发.docx-道客多多

资源描述

1、基于 TMS320C6200 系列 DSP 芯片的应用与开发赵训威编著人民邮电出版社图书在版编目（ CIP）数据基于 TMS320C6200 系列 DSP 芯片的应用与开发/赵训威编著.北京：人民邮电出版社， 2002.5 ISBN 7-115-10279-1. 基 .赵 .数字信号信号处理数字通信系统， TMS320C6200 DSP .TN91 1.72 中国版本图书馆 CIP 数据核字（ 2002）第 028946 号内容提要本书详细地介绍了 TMS320C6200 系列数字信号处理器（ DSP）

2、的硬件结构和指令系统，重点阐述了在 DSP 的硬件设计和在软件编程方面的开发应用。本书共包括 7 章和 1 个附录，第 1 3 章主要介绍了 TMS320C6200 系列 DSP 的硬件结构、软件结构、汇编指令以及流水线，介绍了各种 TMS320C6200 系列 DSP 开发工具和开发过程；第 4、5 章全面介绍了 TMS320C6200 系列 DSP 的硬件开发、软件开发和优化方法；第 6 章介绍了 DSP/BIOS 实时库的功能和使用；第 7 章结合实际应用介绍了各种优化方

3、法在不同算法中的实际应用；附录介绍了 TMS320C6200 系列 DSP 的伪指令用法。本书内容新颖，实用性强，书中包括大量的源程序和应用举例，使读者在了解 TMS320C6200 系列 DSP 的原理和结构的基础上，能较快地掌握基于 TMS320C6200 系列 DSP 的系统设计和软硬件开发方法。本书适合各领域内从事信号处理的科研和工程技术人员阅读，也可以供信息与信号处理、通信电子等专业的教师、研究生以及高年级本科生参考。基于 TMS320C6200 系列 DSP 芯片的应用与开发。编著赵训威责任编辑执行编辑马嘉董静。人民邮电出版社出版发行北京市

4、崇文区夕照寺街 14 号邮编 100061 电子函件 315 网址 http:/读者热线： 010-67129212 010-67129211（传真）北京汉魂图文设计有限公司制作北京厂印刷新华书店总店北京发行所经销。开本： 7871092 1/16印张： 23.2字数： 571 千字印数： 1 0 000 册2002 年月第 1 版2002 年月北京第 1 次印刷ISBN 7-115-10279-1/TP.2857定价：35.00 元本书如有印装质量问题，请与本社联系电话：（ 010）6 7129223 1 前言

5、数字信号处理器是在将模拟信号变换成数字信号以后对其进行高速实时处理的专用处理器，其处理速度比普通 CPU 快 10 50 倍。 1982 年世界上诞生了首枚 DSP 芯片，经过 20 多年的发展，DSP 已成为通信、计算机、消费类电子产品等领域的基础器件。1997 年世界 DSP 市场营销额超过 32 亿美元，预计未来的年均增长率将高达 40%，按照这一增长速度，至 2007 年，世界 DSP 市场营销额将突破 500 亿美元。TI（ Texas Instrument

6、s）公司是较大的 DSP 生产厂商之一，其产品遍及全球，每 2 个数字蜂窝电话中就有 1 个采用 TI 公司的产品，全世界 90%的硬盘和 33%的 Modem 均采用 TI DSP 技术。 1997 年，TI 公司设立了 1 亿美元的风险基金，支持那些需要启动资金的 DSP 应用企业；启动了 500 万美元的全球大学科研基金，用于支持各高校的 DSP 教育，目前 TI 已在国内十余所大学建立了 DSP 实验室和技术中心。TMS320C6200 系列 DSP 是 TI 最新推出的一款高端

7、DSP。在芯片的设计上瞄准多通道无线通信和有线通信应用领域，例如蜂窝无线基站、调制解调器堆等应用。实际上 TMS320C6200 系列 DSP 以其高速的处理能力和出色的对外接口速度可以应用于更为广阔的领域。TMS320C6200 系列 DSP 硬件上采用 VLIW（ Very Long Instruction Word 超长指令字）结构设计并采用 0.5m0.35mCMOS 工艺，其处理速度已高达 2000MIPS（ Million Instructions Per Second），按照 CMOS 的发展趋势，D SP 的运算速度再提高 10

8、0 倍（达到 1600GIPS）是完全有可能的； DSP 系统设计方法已由传统的面向硬件的设计变为基于软件的设计， TMS320C6200 系列 DSP 的开发工具能很好地支持这一设计思想，充分利用 C6200 的 VLIW 并行结构，大大提高了 C 语言的编译效率，并创新地使用了线性汇编和 C6200 汇编优化器，使代码效率可达到 95 ，同时极大地缩短了编程开发时间； TI 在 DSP 业界首先提出的软件集成开发环境 Code Compos

9、er Studio 能有效地提高代码效率，并降低开发难度，将应用产品上市时间大大缩短。此外，TI 还为 DSP 的开发配套提供 A/D、 D/A 等模拟器件和电源设备，可简化外围电路的设计，为 DSP 应用提供一体化的解决方案。本书共包括 7 章和 1 个附录，详细地介绍了 TMS320C6200 系列数字信号处理器（ DSP）的硬件结构和指令系统，重点阐述了在 DSP 的硬件设计和在软件编程方面的开发应用。第 1 章简要介绍了 DSP 的发展历程，分析了 DSP 和一般 CPU 的区别以及 DSP 的选型，结合各大 DSP 厂商的最新产品

10、探讨 DSP 技术的发展前景。第 2 章介绍了 TMS320C6200 系列 DSP 硬件结构、指令系统及流水线。第 3 章 TMS320C6200 开发工具和开发过程，包括代码产生工具、系统集成与代码调试工具以及 Code Composer Studio 等应用开发工具，并举例介绍了 DSP 应用开发过程。第 4 章全面介绍了 TMS320C6200 系列 DSP 的硬件开发，包括 DSP 片内资源的存取与控制，与外部存储器以及其他设备的接口设计相关技术等。第 5 章详细介绍了 TMS

11、320C6200 的软件开发和优化方法。第 6 章详细介绍了 DSP/BIOS 实时库的功能和使用。 2 第 7 章举例介绍了 TMS320C6200 系列 DSP 的应用开发，以 3G 移动通信中的多径接收机和 Turbo 译码器为例介绍各种优化方法在不同算法中的实际运用，最后以一个实际的 TMS320C6201 多通道声码器为例系统全面地介绍了 TMS320C6200DSP 的多通道应用开发过程。附录介绍了 TMS320C6200 系列 DSP 的伪指令用法。本书在注意系统性和新颖性的

12、同时突出了实用性，总结了作者从事 TMS320C6200 系列DSP 应用开发的实践经验。书中包括大量的源程序和应用举例，相信对技术决策者和开发工程师会有所帮助。感谢德州仪器亚洲产品信息中心的支持，感谢李月莲对本书文稿进行了大量的整理工作。由于作者水平有限，加之时间仓促，书中难免存在疏漏之处，敬请广大读者批评指正。作者的 E-mail 地址：。作者 1 目录第 1 章综述 11.1 DSP 技术的发展历程 .11.2 数

13、字信号处理器（ DSP）与通用微处理器（ MPU） 21.2.1 总线结构不同 .21.2.2 流水线 .31.2.3 寻址方式 41.2.4 特殊的硬件结构 .41.2.5 支持多处理器结构 .41.3 DSP 的选型和设计方案确定 .51.4 DSP 技术的发展方向 .91.4.1 微处理器（ MPU）和数字信号处理器（ DSP）混合 91.4.2 DSP+RTOS .91.4.3 支持高级编程语言的 DSP 开发软件 .101.4.4

14、并行处理结构 .111.4.5 功耗越来越低 .11第 2 章 TMS320C6200 处理器和指令系统 132.1 概述 132.2 VLIW 和 VelociTI 132.3 CPU 结构 .142.4 TMS320C6200 数字信号处理器指令集 .202.5 流水线 492.5.1 概述 492.5.2 取指 502.5.3 解码 512.5.4 执行 522.5.5 不同指令的执行流水 532.5.6 影响流水线效率的因素 56第 3 章 TMS320C6200 开发工具和开

15、发过程 623.1 TMS320C6200 开发流程 .623.2 代码生成工具 .633.2.1 工具描述 633.2.2 代码优化器 .633.3 TMS320C6201 EVM 板 653.4 Coder Composer Studio 的实时调测 .673.5 使用 CCS 开发 TMS320C6200 应用举例 .69 2 第 4 章 TMS320C6200 系列 DSP 的硬件开发 .754.1 综述 754.2 片内存储器 .764.2.1 简介 764.2.2 片内程序区 .764.2.3 片内数据区

16、 .794.2.4 C6211 的两级内存储器 .834.3 外部存储器接口的设计与应用 .884.3.1 概述 884.3.2 EMIF 控制寄存器 .904.3.3 异步接口设计 .924.3.4 FIFO 接口 .1024.3.5 SBSRAM 接口设计 .1124.3.6 SDRAM/SGRAM 接口 1164.3.7 Hold 接口 1284.3.8 存储器申请的仲裁 .1294.3.9 C6200 EMIF 配置操作举例 1304.4 DMA 控制器 1334.4.1 概述 1334.4.2

17、DMA 的初始化和启动 .1344.4.3 传输控制：同步与地址产生 1394.4.4 单一通道的分裂操作 1464.4.5 资源仲裁和优先级设置 1474.4.6 DMA 通道的状态 .1484.4.7 DMA 的性能、外管脚和调试控制 1494.5 主机口（ HPI） .1494.5.1 概述 1494.5.2 有关信号与控制寄存器 1514.5.3 主机口的存取操作 .1544.5.4 HPI 的自加载操作 1574.6 TMS320C620

18、0 的引导 .157第 5 章 TMS320C6200 系列 DSP 的软件优化编程 1595.1 概述 .1595.2 优化 C/C+代码 .1605.2.1 C/C+代码的编写 1605.2.2 编译 C/C+代码 .1615.2.3 优化 C 代码 1635.3 通过线性汇编优化汇编代码 .1675.3.1 写并行代码 .1675.3.2 使用字访问 short 型数据 .1705.3.3 软件流水 .1735.3.4 多循环周期的模安排 182 1 5.3.5 循环传递路径 .194

19、5.3.6 循环中的 If-Then-Else 语句 1995.3.7 循环展开 .2025.3.8 生命太长问题 .2065.3.9 消除冗余取 .2125.3.10 存储体 .2175.3.11 外环软件流水 .2265.3.12 与内环一起有条件地执行外环 .2295.4 C 语言和汇编的混合编程 .2395.4.1 寄存器使用规则 .2395.4.2 函数结构及调用规则 2405.4.3 在 C/C+程序中插入汇编语言 .242第 6 章 DSP/BIOS

20、功能与使用 2466.1 DSP/BIOS 的功能和组成 .2466.1.1 什么是 DSP/BIOS 2466.1.2 DSP/BIOS 的组件 2466.1.3 DSP/BIOS 的特点和优点 2486.1.4 DSP/BIOS 中一些重要的命名规则 2496.2 利用 DSP/BIOS 生成程序 .2506.2.1 开发步骤 .2506.2.2 使用 DSP/BIOS 配置工具（ DSP/BIOS configuration tool） 2516.2.3 创建 DSP/BIOS 程序所用的文件 .2516.2

21、.4 程序的编译 .2526.2.5 DSP/BIOS 程序的启动顺序 2566.3 线程调度 .2576.3.1 线程的概念和类型 .2576.3.2 硬件中断 .2586.3.3 软件中断 .2616.3.4 任务（ Task） .2696.3.5 等待循环 .2726.3.6 旗语（ Semaphores） .2726.3.7 信箱 2766.3.8 定时器和时钟 .2796.3.9 周期函数管理器（ PRD）和系统时钟 2806.3.10 使用运行图来观察程序的运

22、行 .2816.4 内存和底层函数 .2826.4.1 存储器管理 .2836.4.2 系统服务 .2866.4.3 队列（ QUE） 2866.5 输入 /输出 2906.5.1 I/O 综述 2906.5.2 数据管道管理器（ PIP 模块） 2916.5.3 主机通道管理器（ HST 模块） 293 2 6.5.4 管道和流的比较 .2946.5.5 一个使用 DSP/BIOS 的音频例子 295第 7 章 TMS320C6200 系列 DSP 的应用开发举例 .2977.1

23、 WCDMA RAKE 接收机在 TMS320C6200DSP 器件上的实现 2977.1.1 CDMA 原理 2977.1.2 基本系统 .2997.1.3 RAKE 接收机的实现 .3047.1.4 载入 TMS320C6200 DSP 器件 3107.1.5 结论 3117.2 WCDMA Turbo 译码器在 TMS320C6200DSP 器件上的实现 .3117.2.1 Turbo 编码器、译码器结构及译码算法 3117.2.2 MAP 译码器的实现 .3147.3 多通道声码器在 TMS

24、320C6200DSP 器件上的实现 .3327.3.1 G.723.1 语音编码算法 .3327.3.2 多通道声码器的设计 3347.3.3 G.723.1 多通道声码器的实现 .339附录伪指令 354第 1 章综述 1 第 1 章综述伴随着信息社会的数字化浪潮，数字信号处理技术成为数字化社会最重要的技术之一。数字信号处理系统是接收模拟信号，如光和声信号，将其转化成为数字信号 0 和 1，以进行实时的数字技术处理。 DSP 可以代表数字信号处理技术（ Digital Signal Process），也可以代表数

25、字信号处理器（D igital Signal Processor），其实两者是不可分割的，前者是理论上的技术，后者是前者的实时实现。二者结合起来就成为解决实际问题的方案数字信号处理解决方案（D SPs）。本书中如无特殊说明，D SP 均指数字信号处理器。本章将首先总结 DSP 的发展历程，然后分析它和一般 CPU 的区别，最后结合各大 DSP厂商的最新产品探讨 DSP 技术的发展前景。1.1 DSP 技术的发展历程20 世纪 60 年代以前，数字信号处理技术一直被认为是一种应用面非常狭窄的技术，只能应用在导弹和语音识别等几种系统中。后来随着各种快速算法的出现和大规模集

26、成电路的发展， DSP 市场 1999 年销售额己达 40 亿美金，数字信号处理器的处理能力也从最初的 5MIPS（ Million Instructions Per Second）向 1GMIPS 发展。DSP 发展历程大致分为 3 个阶段：基础研究阶段、产品普及阶段和腾飞阶段。基础研究阶段在 DSP 出现之前数字信号处理只能依靠通用 MPU（微处理器）来完成。但 MPU 较低的处理速度无法满足高速实时的要求。 1965 年，库利（Cool ey）和图基（T ukey）发表

27、了著名的快速傅立叶变换（F FT Fast Fourier Transform），极大地降低了付氏变换的计算量，从而为数字信号的实时处理奠定了算法基础。与此同时伴随着集成电路技术的发展，产生了一些通用处理器结构加上专用乘法器构成的 DSP 芯片，如 1979 年 Intel 公司推出的 2920 芯片， AMI 公司的 S2811 芯片。在这一阶段用硬件来实现各种数字滤波和 FFT 受到了极大的关注，但是，那时研制出来的 DSP 系统是由分立元件组成的，其应用领域仅局限于军事或航空航天部门。产品普及阶段随着大规模集成电路技术的发展，1982 年德州仪器推出了其第一代 D

28、SP 芯片 TMS32010。这种 DSP 器件采用微米工艺 NMOS 技术制作，虽功耗和尺寸稍大，但运算速度却比 MPU 快了几十倍，尤其在语音合成和编码解码器中得到了广泛应用。 TMS32010 芯片的问世是个里程碑，它标志着 DSP 应用系统由大型系统向小型化方向迈进了一大步。至 20 世纪 80 年代中期，随着 CMOS 技术的进步与发展，第二代基于 CMOS 工艺的 DSP 芯片应运而生，其存储容量和运算速度成倍提高，为语音处理、图像硬件处理技术的发展奠定了基础。 20 世纪 80 年代后期，以 TI 公

29、司的 TMS320C30 为代表的第三代 DSP 芯片问世，开发者可以使用高级语言编程，大大降低了开发难度，缩短了开发的时间。伴随着运算速度的进基于 TMS320C6200 系列 DSP 芯片的应用与开发 2 一步提高，其应用范围逐步扩大到通信、计算机领域。腾飞阶段进入 20 世纪 90 年代以后， DSP 发展更快，新技术层出不穷。相继出现了第四代和第五代 DSP 器件。现在的 DSP 属于第五代产品，它与第四代相比，系统集成度更高，速度更快，功耗却越来越小。将 DSP 芯核及外围元件集成在单一芯片上，有的甚至将多个

30、 DSP 核集成在一个片内，这种集成度极高的 DSP 芯片不仅在通信、计算机领域大显身手，而且逐渐渗透到人们日常消费领域。经过 20 多年的发展， DSP 产品的应用己扩大到人们的学习、工作和生活的各个方面，并逐渐成为电子产品更新换代的决定因素。目前，对 DSP 爆炸性需求的时代己经来临，前景十分可观。1.2 数字信号处理器（ DSP）与通用微处理器（ MPU）DSP 和 MPU 有很多相似的地方，例如都有相同层次上的集成，相同的时钟频率等，但是在数字信号

31、处理领域， DSP 则具有无可比拟的优势，这主要是由二者在设计上的不同决定的。1.2.1 总线结构不同所谓数字信号处理就是把一系列输入信号经过各种运算、变换转换为输出信号，其关键就在于如何快速、高效地进行大量数学运算。普通计算机都有数据处理和数学运算的功能，但却很难两者兼顾都达到最优效果，而数字信号处理器是针对数字信号处理中特殊的数学运算而设计的一类微处理器。执行数字信号处理算法的一个最大的瓶颈是从存储器中频繁传输大量数据信息，包括输入信号采样、滤波器系数以及程序指令等等。针对这个问题，数字信号处理器采用了和传统计算机不

32、同的结构。传统计算机采用最简单的冯诺依曼（V on Neuman）结构，即程序指令和数据共用一个存储空间和单一的地址和数据总线。处理器要执行任何指令时，都要先从存储器中取出指令，解码，再取操作数，执行运算，即使单条指令也要耗费几个甚至几十个周期。所有的数字信号处理器都采用哈佛（ Harvard）结构，哈佛结构是不同于传统的冯诺依曼（V on Neuman）结构的并行体系结构，如图 1.1 所示。其主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，

33、独立访问，即程序指令和数据的存取空间分开，各有自己的程序总线和数据总线。这样处理器可以同时处理数据和程序，大大地提高了处理器的处理能力。为了更好地适应数字信号处理，许多厂家对哈佛结构做了改进，采用三条总线即一条程序总线和两条数据总线，原因是多数数字信号处理操作只需要两个操作数。TI 公司的 TMS320 系列 DSP 做的改进更大，一是允许数据存放在程序存储器中，并被算术运算指令直接使用，增强了芯片的灵活性：二是指令存储在高速缓冲器（Cache ）中，当执行此指令时，不需要再从片外存储器中读取指令，节约了一个指令周期的时间。例如最

34、新的 TMS320C6200 系列 DSP 整个片内程序存储器都可以配制成高速缓存。第 1 章综述 3 存储器数据和指令地址总线数据总线CPUa. 冯诺依曼结构（单存储器）PM 地址总线程序 DM 地址总线数据存储器 CPUPM 数据总线 DM 数据总线存储器b. 哈佛结构（双存储器）图 1.1 冯诺依曼结构与哈佛结构比较1.2.2 流水线与哈佛结构相似， DSP 芯片广泛采用流水线以减少指令执行时间，从而增强了处理器的

35、处理能力。流水线处理器是由一系列叫做片断或部分的处理电路组成的。操作数流经过每个片断，即每个片断对操作数进行部分处理。操作数经过所有片断后才能得到最后结果。流水线操作即把一条指令分成一系列步骤来完成，不同步骤完成不同的任务。一条指令只有经过所有步骤才能得到结果。这些步骤可以独立进行，这样就可以实现多条指令在不同的步骤上重叠运行，从而加快运行速度。通过一个日常生活中的例子，可以清楚地说明流水线是如何操作的。我们洗奥衣服时，可以经过三道工序：洗衣、晾晒、奥平。当第一件衣服进入晾晒阶段时，我们可以把第二件衣服放入洗衣机：而当第一件衣服拿去奥平时，第二件衣服可以拿去晾晒，当然第三件衣服

36、就可以投入洗衣机了。把一项大任务分成若干可以重叠执行的小任务能够提高效率，流水线操作正是利用了这种方法。流水线又分为指令流水线和算术流水线。指令流水线是指取指令和执行指令的不同阶段在流水线上进行。算术流水线是指算术操作的不同阶段在流水线上进行。 DSP 芯片一般都采用指令流水线方法。如图 1.2 所示，在三级流水线操作中，取指、译码和执行操作可以独立地处理，这可使指令执行完全重叠。在

37、每个指令周期内，3 个不同的指令处于激活状态，每个指令处于不同的阶段。例如，在第 N 个指令取指时，前面一个即第 N-1 个指令正在译码，而第 N-2 个指令则正在执行。一般说来，流水线对用户是透明的。基于 TMS320C6200 系列 DSP 芯片的应用与开发 4 CLKOUT1N取指N-1译码执行 N-2N+1NN-1N+2N+1N图 1.2 流水线操作1.2.3 寻址方式在数字信号处理中要遇到大量的地址运算，在某些情况下，地址运算量甚至超过了数据的运算量。例如在通用型微处理器 8086 中，加法需要 3 个时钟周期，

38、但是对于这条指令中涉及的地址的运算就需要 512 个时钟周期。数字信号处理器中都设计有一个特殊的硬件算术单元地址产生器。地址的计算由这个专门的硬件来负责，不需要耗费额外的时间。现在的某些微处理器中也有独立的地址产生单元，对于一些特殊的地址运算，如累加、累减等，不需要耗费额外的 CPU 时间， DSP 的地址运算单元更强大，支持例如比特翻转寻址和循环寻址，可以大大加快傅立叶变换（ FFT）等的运算速度，对于非哈佛结构的处理器可能需要更多的处理周期。1.2

39、.4 特殊的硬件结构数字信号处理中的基本运算是乘法和累加，例如在卷积、数字滤波、快速傅立叶变换等算法中有大量的类似 A(k )B(n k ) 的运算，他们要占用大量的 CPU 时间，而 DSP 中一般都设置了硬件乘法器和 MAC（乘法并累加），这些操作往往可以在单周期内完成，从而大幅提高了 DSP 做乘法和累加的速度。数学运算消耗的时间往往少于存储器的操作，例如在 8086 中，寄存器对寄存器的加法只需要 3 个时钟周期，而寄存器对存储器的加法则需要 14 21 个时钟周期。通用型微处理器片内往往集成了一块几百 KB 的高速缓存（Cac he），却没有集

40、成存放程序或数据的 ROM 或 RAM，因为通用型微处理器上运行的程序可能非常巨大，片内不可能容纳，因此需要在片内加高速 Cache，将要执行的数据从片外取进片内来执行以加快速度。相对而言数字信号处理的程序虽然计算量巨大，但是一般情况下程序体并不是十分的巨大，所以 DSP 芯片在片内集成了大容量的 ROM 来存放程序， RAM 来存放数据。程序在片内执行的效率远远高于相同规格的通用微处理器。这样既降低了产品的体积和成本，又加快了处理速度。1.2.5 支持多处理器结构无论处理器变得多么强大，如果没有多

41、处理器的支持，就会有相当数量的应用需求得不第 1 章综述 5 到满足，如在图像压缩、雷达定位等应用中运算量巨大，单个处理器无法胜任。虽然目前在多处理器设计中己有多种处理器可供采用，更有一些厂家在多处理系统处理器的研制上下了功夫。例如 Pentium Pro（ CISC 机）和 PowerPC 为多处理器配置提供外部的存储器接口支持。这种配置允许每一个处理器共享一对公共的或共享的存储器块的访问，这可以被称为一种松稠合的系统，然而， DSP 更向前跨了一步，它支持精细任务并发的紧稠合系统。 TMS320C40 和 ADSP

42、2106X SHARC DSP 都提供了处理器间多达 6 个 32 位的专用链接，从而支持紧稠合系统。 SHARC DSP 还前进了一步，它支持多处理器对内部 SHARC 存储器的访问并支持外部的存储器。由于 DSP 具有这种专用的多处理器支持，因此可以把算法划分给很多 DSP，建立一个借助专用链接支持实现精细任务并发的处理器阵列。处理器阵列的规模可以按照应用来确定，例如 TMS320C80 内部就有 8 个微处理器，他们通过共享数据存储空间来交换信息。除此之外，各大 DSP 厂商都针对自己的产品推出了高效易用的开发系统和实时调测工具，像 TI 公司的 Code Co

43、mposer Studio 和 AD 公司的 Visual DSP，利用他们可以方便地对自己的算法进行实时仿真、调测。更重要的是在 DSP 中加入了基于 JTAG 扫描的仿真逻辑，它允许实现非破坏的源码级调试能力。通过 JTAG，所有的内部寄存器都得到监控，而不干扰实时代码。例如，通过对主机调用的监控可以确定任务的状态。1.3 DSP 的选型和设计方案确定数字信号处理算法的数据格式有定点和浮点之分，因为对浮点数据和定点数据 DSP 要提供不同类型的支撑

44、平台，所以选用恰当的数据格式是 DSP 设计决策的关键之一。另外，数字信号处理系统采用的数据格式决定了它所处理信号的处理精度、动态范围和信噪比，并且不同的数据格式的易用性和开发难度也不一样。1 数的定点表示在定点 DSP 芯片中，采用定点数进行数值运算，其操作数用整型数来表示。一个整型数的最大范围取决于 DSP 芯片所给定的字长，一般为 16 位或 32 位。显然，字长越长，所能表示的数的范围越大，精度也越高。下面以 16 位字长为例加以说明。DSP 芯片的数以 2 的补码形式表示。每个 1

45、6 位数用一个符号位来表示数的正负， 0 表示数值为正，1 则表示数值为负。其余 15 位表示数值的大小。因此，二进制数 0010000000000011b=8195二进制数 11111111111111100b=-4那么，DSP 芯片如何处理小数呢？这就引入了数的定标的概念。通过设定小数点在 16 位中的不同位置，就可以表示不同大小和不同精度的小数，这就叫数的定标。数的定标有 Q 表示法和 S 表示法两种。表 1.1 列出了一个 16 位数的 16 种 Q 表示、 S 表示及它们

46、所能表示的十进制数值范围。基于 TMS320C6200 系列 DSP 芯片的应用与开发 6 表 1.1 定点数的 Q 表示、 S 表示及数值范围Q 表示 S 表示十进制数表示范围Q 15 S 0.15 -1三 x 三 0.9999695Q 14 S 1.14 -2三 x 三 1.9999390Q 13 S 2.13 -4三 x 三 3.9998779Q 12 S 3.12 -8三 x 三 7.9997559Q 11 S 4.11 -16三 x 三 15.9995117Q 10 S 5.10 -32三 x 三 31.9990234Q 9 S 6.9 -64三 x 三 63.9980469Q 8

47、 S 7.8 -128三 x 三 127.9960938Q 7 S 8.7 -256三 x 三 255.9921875Q 6 S 9.6 -512三 x 三 511.9804375Q 5 S 10.5 -1024三 x 三 1023.96875Q 4 S 11.4 -2048三 x 三 2047.9375Q 3 S 12.3 -4096三 x 三 4095.875Q 2 S 13.2 -8192三 x 三 8191.75Q 1 S 14.1 -16384三 x 三16383.5Q 0 S 15.0 -32768三 x 三32767从表 1.1 可以看出，同样一个 16 位数

48、，若小数点设定的位置不同，它所表示的数也就不同。例如，十六进制数 2000H=8192，用 Q 0 表示。十六进制数 2000H=0.25，用 Q 15 表示。但对 DSP 芯片来说，处理方法是完全相同的。从表 1.1 还可以看出，不同的 Q 表示的数不仅范围不同，而且精度也不相同。 Q 越大，数值范围越小，精度越高：相反， Q 越小，数值范围越大，精度就越低。例如， Q 0 的数值范围为 -32768 +32767，其精度为 1，而 Q 15 的数值范围为 -1 0.9999695，精度为 1/32

49、768。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价：而想精度提高，则数的表示范围就相应地减小。浮点数与定点数的转换关系可表示如下：浮点数（ x）转换为定点数（ xq） :xq=（ int） x2Q第 1 章综述 7 定点数（ xq）转换为浮点数（ x） :x=（ float） xq2-Q例如，浮点数 x=0.5，定标 Q=15，则定点数 xq=0.532768=16384，式中表示下取整。反之，一个用 Q=15 表示的定点数 16384，其浮点数为 163842-15=0.5。浮点数转换为定点数时，为了降低截尾误差，在取整前可以先加上 0.5。2 数的定点运算将浮点加 /减法转化为定点加 /减法时最重要的一点就是必须保证两个操作

展开阅读全文