1、DSP原理及应用,讲授:黄 勇 (讲 师) 邮箱: 电话:13517181354,推荐参考书,1、TMS320C54X DSP 结构、原理及应用, 戴明 桢等编著,2001,北京航空航天大学出版社 2、DSP技术的发展与应用,彭启琮等编著, 2002,高等教育出版社 3、 TMS320C54X DSP 应用程序设计与开发,刘 益成主编,2002,北京航空航天大学出版社,推荐网站,1、 2、 3、 4、,第一章 DSP绪论,1.1 DSP技术(1)Digital Signal Processing数字信号处理(2)Digital Signal Processor数字信号处理器本课程主要内容:介绍
2、处理器以及在数字信号处理器上如何实现数字信号处理算法。,1.2 为什么要使用DSP(1)信息化的基础是数字化;(2)数字化的核心技术之一数字 信号处理;(3)数字信号的处理任务,特别是实时处理的任务,在很大程度上需要由DSP器件或以DSP为核心的ASIC来完成。(4)DSP技术已经成为人们日益关注的并得到迅速发展的前言技术。,1.3 举例,(1)移动通信系统,GSM手机简化框图,(2)数码相机,数字相机框图,(3)飞机驾驶模拟器,(4)全球定位系统(GPS),(5)雷达/声纳,(6)巡航导弹,(7)F-117发射激光制导灵巧炸弹,美制GBU-39灵巧炸弹,(8)图像识别,(9)图像鉴别,(10
3、)其它,(1)医院用的B超,CT,核磁共振等等; (2)卫星遥感遥测; (3)天气预报,地震预报,地震探矿; (4)风动试验; (5)数字化士兵,数字化战争; DSP的应用领域取决于设计者的想象空间。,数字化决定未来,(1)程控交换机取代模拟交换机 (2)GSM和CDMA取代模拟通信系统 (3)数字相机普及,胶卷行业和洗印业 (4)数字化电视取代模拟电视 (5)从根本上说,以计算机为中心的技 术革命正在改变着工业、农业、科 学技术、 教育、国防的面貌,正在改变人们的生活 习惯和思维习惯。,1.4 信号处理的发展,(1)现代信号处理的标志傅立叶变换(19世纪初叶) (2)两个方面的含义信号分析:
4、加深对信号特性的理解, 如:a.用频谱仪分析信号,了解其频谱分布、噪声、杂散等b.技术监督部门用以检查商品质量的各种手段,信号处理:改变信号的某些性能,如: a.信号的编码/解码,调制/解调,压缩/解压,扩频/解扩等 b.电视信号的调制是信号处理的杰作(调频的伴音副载频,彩色副载频,残留边带调制),(3)为什么要采用数字信号处理,a.灵活性模拟处理系统:修改硬件设计,或调整硬件参数;数字处理系统:改变软件设置; 例:模拟滤波器、数字滤波器、自适应滤波器,b.精度 模拟处理系统:元器件精度 数字处理系统:A/D的位数、计算机字长、算法,C. 可靠性和可重复性 模拟系统:受环境温度、湿度、噪声、电
5、磁场等的干扰和影响大 数字系统:可靠性和可重复性好,可重复性,d.抗噪声干扰,例:录像带与VCD、DVD在复制上的差别,e.大规模集成 模拟系统:尽管已有一些模拟集成电路,但品种较少,集成度不高、价格较高 数字系统:DSP体积小、功能强、功耗小、一致性好、使用方便,性价比高,模拟信号是不可缺少的,a.实时性 模拟系统:除开电路引入的延时外,处理是实时的 数字系统:由计算机的处理速度决定的,b.高频信号的处理 模拟系统:可以处理包括微波、毫米波、乃至光波信号 数字系统:按照来奎斯特准则的要求,受到S/H、A/D和处理速度的限制,C.模拟与数字信号的转换现实世界的信号绝大多数是模拟的(温度、速度、
6、压力等),转换成的电信号也是模拟的(电流、电压等)。要实现数字处理,就必须进行转换。,1.5 DSP系统,1.5.1 DSP系统的构成 一个典型的DSP系统应包括抗混叠滤波器、数据采集A/D转换器、数字信号处理器DSP、D/A转换器和低通滤波器组成。,DSP系统的处理过程:, 将输入信号x(t)进行抗混叠滤波,滤掉高于折叠频 率的分量,以防止信号频谱的混叠; 经采样和A/D转换器,将滤波后的信号转换为数字 信号x(n); 数字信号处理器对x(n)进行处理,得数字信号 y(n); 经D/A转换器,将y(n)转换成模拟信号; 经低通滤波器,滤除高频分量,得到平滑的模拟信 号y(t)。,1.6 DS
7、P系统的设计过程,设计步骤分几个阶段: (1)明确设计任务,确定设计目标 (2)算法模拟,确定性能指标 (3)选择DSP芯片和外围芯片 (4)设计实时的DSP应用系统 (5)硬件和软件调试 (6)系统集成和测试,根据需求写出任务书 确定设计目标,算法研究和系统模拟实现 定义系统性能指标,选择DSP芯片 和外围芯片,硬件设计,硬件调试,软件设计,软件调试,系统集成和测试,1.7 DSP芯片的特点,数字信号处理不同于普通的科学计算与分析,它强调运算的实时性。除了具备普通微处理器所强调的高速运算和控制能力外,针对实时数字信号处理的特点,在处理器的结构、指令系统、指令流程上作了很大的改进,其主要特点如
8、下: 1采用哈佛结构 DSP芯片普遍采用数据总线和程序总线分离的哈佛结构或改进的哈佛结构,比传统处理器的冯诺伊曼结构有更快的指令执行速度。,(1) 冯诺伊曼(Von Neuman)结构该结构采用单存储空间,即程序指令和数据共用一个存储空间,使用单一的地址和数据总线,取指令和取操作数都是通过一条总线分时进行。当进行高速运算时,不但不能同时进行取指令和取操作数,而且还会造成数据传输通道的瓶颈现象,其工作速度较慢。,(2)哈佛(Harvard)结构该结构采用双存储空间,程序存储器和数据存储器分开,有各自独立的程序总线和数据总线,可独立编址和独立访问,可对程序和数据进行独立传输,使取指令操作、指令执行
9、操作、数据吞吐并行完成,大大地提高了数据处理能力和指令的执行速度,非常适合于实时的数字信号处理。微处理器的哈佛结构如下图所示。,外部管理数据总线,外部管理地址总线,数据总线,数据地址总线,程序数据总线,程序地址总线,外部管理数据总线,外部管理地址总线,数据总线,数据地址总线,程序数据总线,程序地址总线,2、采用多总线结构,DSP芯片都采用多总线结构,可同时进行取指令和多个数据存取操作,并由辅助寄存器自动增减地址进行寻址,使CPU在一个机器周期内可多次对程序空间和数据空间进行访问,大大地提高了DSP的运行速度。如:TMS320C54x系列内部有P、C、D、E等4组总线,每组总线中都有地址总线和数
10、据总线,这样在一个机器周期内可以完成如下操作: 从程序存储器中取一条指令; 从数据存储器中读两个操作数; 向数据存储器写一个操作数。,TMS320C54x 哈佛结构,TMS320C5402,以TMS320VC5402为核心芯片的实验箱功能框图,3采用流水线技术(pipeline),利用这种流水线结构,加上执行重复操作,就能保证在单指令周期内完成数字信号处理中用得最多的乘法 - 累加运算。如:,4. 配有专用的硬件乘法-累加器,可在一个周期内完成一次乘法和一次累加操作,从而可实现数据的乘法-累加操作。如卷积、矩阵运算、FIR和IIR滤波、FFT变换等算法。其中都有A(k)B(n-k) 一类的运算
11、,大量重复乘法和累加。DSP有硬件乘法器,用MAC(取数、乘法、累加)在单周期完成(P54)。通用计算机的乘法用软件来实现,用若干个机器周期。 5. 具有特殊的DSP指令 如:TMS320C54x中的FIRS和LMS指令,专门用于完成系数对称的FIR滤波器和LMS算法(P60)。,6快速的指令周期 由于采用哈佛结构、流水线操作、专用的硬件乘法器、特殊的指令以及集成电路的优化设计,使指令周期可在20ns以下。 7硬件配置强 新一代的DSP芯片具有较强的接口功能,除了具有串行口、定时器、主机接口(HPI)、DMA控制器(与通用处理器的DMA有区别)、软件可编程等待状态发生器等片内外设外,还配有中断
12、处理器、PLL、片内存储器、测试接口等单元电路,可以方便地构成一个嵌入式自封闭控制的处理系统。,8支持多处理器结构为了满足多处理器系统的设计,许多DSP芯片都采用支持多处理器的结构。如:TMS320C40提供了6个用于处理器间高速通信的32位专用通信接口,使处理器之间可直接对通,应用灵活、使用方便; 9省电管理和低功耗DSP功耗一般为0.54W,若采用低功耗技术可使功耗降到0.25W,可用电池供电,适用于便携式数字终端设备。,1.8 DSP芯片的选择,在进行DSP系统设计时,选择合适的DSP芯片是非常重要的一个环节。通常依据系统的运算速度、运算精度和存储器的需求等来选择DSP芯片。 一般来说,
13、选择DSP芯片时应考虑如下一些因素。 1DSP芯片的运算速度 2DSP芯片的价格 3DSP芯片的运算精度 4DSP芯片的硬件资源 5DSP芯片的开发工具 6DSP芯片的功耗 7其它因素,1.9 DSP产品简介,目前,在生产通用DSP的厂家中,最有影响的公司有:TI公司(美国德州仪器公司) AT&T公司(现在的Lucent公司)Motorola公司ADI公司NEC公司其他公司,(1)TI公司(P2),该公司自1982年推出第一款定点DSP芯片(TMS32010)以来,相继推出定点、浮点和多处理器三类运算特性不同的DSP芯片,共计已发展了七代产品。其中,定点运算单处理器的DSP有七个系列,浮点运算
14、单处理器的DSP有三个系列,多处理器的DSP有一个系列。主要按照DSP的处理速度、运算精度和并行处理能力分类,每一类产品的结构相同,只是片内存储器和片内外设配置不同。,a.TI目前主推3个系列。(P4) b.定点DSP(Q表示法)与浮点DSP(指 数表示)两者在成本与易用性方面仍有某些差异,但随着时间的推移,上述差异已经不大。对设计人员最具重要性的特性在于浮点格式具有更高的算术灵活性与精确度。对高保真音频以及需要实数运算、更高精确度与较大动态范围的其它数据集应用而言,浮点 DSP 是最佳的解决方案。,c.定点数简介,含义:计算机中采用的一种数的表示方法。参与运算的数的小数点位置固定不变。 整数
15、DSP芯片和所有微处理一样,以2的补码形式表示有符号数。16位定点DSP整型数格式为: Sxxxxxxxxxxxxxxx其中最高位S为符号位。0表正数,1表负数,其余为数据位。数的范围是3276832767 整数的最大取值范围取决于DSP的字长。字长越长,所能表示的数据范围越大,精度越高。若一个整数字长为n,则其取值范围为-2n2n-1。整数的最小分辨率为1。,小数 16位定点DSP中小数表示为: S.xxxxxxxxxxxxxxx 其中最高位S为符号位。其余各位采用2的补码表示,小数点紧接着符号位。无整数位。数的范围是(11),小数的最小分辨率为2的15次,数的定标(确定小数点位置)定点表示
16、并不意味着一定就是整数表示。在许多情况下,需要由编程来确定一个数的小数点位置,即数的定标。定点数最常用的是Qm.n表示法。它可将整数和小数表示法统一起来。M表示数的2补码的整数部分,n表示数2补码的小数部分,1位符号位,数的总字长为m+n+1位。表示数的整数范围为2m2m-1,小数的最小分辨率为2n。几种常见的Qm.n表示法格式(P5):,定点数格式的选择为了确保在整个运算过程中数据不会溢出,在数据参加运算前,首先应估计数据及其结果的动态范围,选择合适的格式对数据进行规格化。,定点格式数据的转换同一个二进制表示的定点数,当采用不同的Qm.n表示方法时,其代表的十进制数是不同的,如 Q15.0表
17、示法,3000H12288 Q0.15表示法,3000H0.375 Q3.12表示法,3000H12288,定点算术运算 两个定点数的加减法定点数的加减法必须保证两个操作数的格式一致。若两个数的Q值不同,可将Q值小的数调整为与另一个数的Q值一样大。需要注意有符号和无符号数加减运算溢出的问题。,例:若x,y为正数,x=4.125, y=0.125.求xy (P7) x采用Q3.12格式表示的十六进制码为:4200H; Y采用Q0.15格式表示的十六进制码为:1000H;由于Q3.12格式与Q0.15格式的整数位相差3位,因此将y的十六进制码1000H右移3位;由于1000H为正数,因此将整数部分
18、补零,得到用Q3.12格式表示的0.125为0200H。将4200H0200H,得到4400H,该数的格式为Q3.12,x+y=4.25,d.定点数与浮点数的比较 (1)数值的表示范围 :浮点表示法所能表示的数值范围将远远大于定点表示法 。 (2)精度 :对于字长相同的定点数与浮点数来说,浮点数虽然扩大了数的表示范围,但这是以降低精度为代价的,也就是数轴上各点的排列更稀疏了 。 (3)数的运算 :浮点运算要比定点运算复杂 。 (4)溢出处理 :定点运算时,当运算结果超出数的表示范围,就发生溢出;而在浮点运算时,运算结果超出尾数的表示范围却并不一定溢出,只有当阶码也超出所能表示的范围时,才发生溢
19、出。,小结:浮点数并不一定等于小数,定点数也并不一定就是整数。所谓浮点数就是小数点在逻辑上是不固定的,而定点数只能表示小数点固定的数值,具体到用浮点数或定点数表示要看用户赋予了这个数的意义是什么。,(2) Lucent公司,定点DSP:DSP16系列 16bit 40MIPS; 浮点DSP:DSP32系列 32bit 12.5MIPS。 MIPS(Million Instructions Per Second ) 每秒处理的百万级的机器语言指令数; 80386 电脑可以每秒处理3百万到5百万机器语言指令;(P12),(3) Motorola公司,定点DSP: DSP56000系列 24bit
20、16MIPS;浮点DSP:DSP96000系列 32bit 27MIPS。,(4)ADI公司,定点DSP:ADSP21xx系列 16bit 40MIPS;浮点DSP:ADSP21020系列 32bit 25MIPS;并行浮点DSP:ADSP2106x系列 32bit 40MIPS;超高性能DSP:ADSP21160系列 32bit 100MIPS。,1.10 DSP芯片的发展现状和趋势,1、DSP芯片的现状 (1)制造工艺早期DSP采用4m的NMOS工艺。现在的DSP芯片普遍采用0.25m或0.18m亚微米的CMOS工艺。芯片引脚从原来的40个增加到200个以上,需要设计的外围电路越来越少,成
21、本、体积和功耗不断下降。 (2)存储器容量早期的DSP芯片,其片内程序存储器和数据存储器只有几百个单元。目前,片内程序和数据存储器可达到几十K字,而片外程序存储器和数据存储器可达到16M48位和4G40位以上。,(3)内部结构 目前,DSP内部均采用多总线、多处理单元和多级流水线结构,加上完善的接口功能,使DSP的系统功能、数据处理能力和与外部设备的通信功能都有了很大的提高。 (4)运算速度近20年的发展,使DSP的指令周期从400ns缩短到10ns以下,其相应的速度从2.5MIPS提高到2000MIPS以上。如TMS320C6201执行一次1024点复数FFT运算的时间只有66S。,(5)高
22、度集成化集滤波、A/D、D/A、ROM、RAM和DSP内核于一体的模拟混合式DSP芯片已有较大的发展和应用。 (6)运算精度和动态范围 DSP的字长从8位已增加到32位,累加器的长度也增加到40位,从而提高了运算精度。同时,采用超长字指令字(VLIW)结构和高性能的浮点运算,扩大了数据处理的动态范围。,(7)开发工具具有较完善的软件和硬件开发工具,如:软件仿真器Simulator、C编译器和集成开发环境CCS等,给开发应用带来很大方便。CCS是TI公司针对本公司的DSP产品开发的集成开发环境。它集成了代码的编辑、编译、链接和调试等诸多功能,而且支持C/C+和汇编的混合编程。,2国内DSP的发展
23、现状,随着中国数字消费类产品需求的大幅增长,以及DSP对数字信号高速运算与同步处理能力的提高,DSP的应用领域将逐渐从移动电话领域扩展到新型数字消费类领域。应用:用于图像压缩与传输等图像信号的处理,语音的编码、合成、识别和高保真等语音信号的处理以及通信信号的调制解调、加密、多路复用、扩频、纠错编码等处理。,3DSP技术的发展趋势,(1)DSP的内核结构将进一步改善多通道结构和单指令多重数据(SIMD)、特大指令字组(VLIM)将在新的高性能处理器中占主导地位,如ADI公司的 ADSP-2116x。(2)DSP 和微处理器的融合微处理器MPU:是一种执行智能定向控制任务的通用处理器,它能很好地执
24、行智能控制任务,但是对数字信号的处理功能很差。 DSP处理器:具有高速的数字信号处理能力。将DSP和微处理器结合起来,可简化设计,加速产品的开发,减小PCB体积,降低功耗和整个系统的成本。,(3)DSP 和高档CPU的融合大多数高档MCU,如Pentium 和PowerPC都是SIMD指令组的超标量结构,速度很快。在DSP中融入高档CPU的分支预示和动态缓冲技术,具有结构规范,利于编程,不用进行指令排队,使DSP性能大幅度提高。 (4)DSP 和SOC的融合 SOC是指把一个系统集成在一块芯片上。这个系统包括DSP 和系统接口软件等。,(5)DSP 和FPGA的融合FPGA是现场可编程门阵列器
25、件。它和DSP集成在一块芯片上,可实现宽带信号处理,大大提高信号处理速度。 (6)实时操作系统RTOS与DSP的结合随着DSP处理能力的增强,DSP系统越来越复杂,使得软件的规模越来越大,往往需要运行多个任务,各任务间的通信、同步等问题就变得非常突出。随着DSP性能和功能的日益增强,对DSP应用提供RTOS的支持已成为必然的结果。,(7)DSP的并行处理结构 为了提高DSP芯片的运算速度,各DSP厂商纷纷在DSP芯片中引入并行处理机制。这样,可以在同一时刻将不同的DSP与不同的任一存储器连通,大大提高数据传输的速率。 (8)功耗越来越低随着超大规模集成电路技术和先进的电源管理设计技术的发展,DSP芯片内核的电源电压将会越来越低。,Gene定律及DSP功耗性能比变化,1.11 三种处理器,1、通用处理器(INTEL CPU) 2、单片机(MCU) 3、DSP,1.12 学习该门课程的特点,(1)算法的问题 (2)涉及到处理器的问题,