1、I(此文档为 word 格式,下载后您可任意编辑修改!)基于语音识别的智能小车摘 要随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。本设计是语音识别在控制领域的一个很好实现,它将原本需要手工操作的工作用语音来方便地完成。语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。从识别对象的类型来看,语音识别可以分为特定人(Speak
2、 er Dependent)语音识别和非特定人(Speaker Independent)语音识别。本设计采用的识别类型是特定人孤 立词语音识别。本系统分上位机和下位机两大方面。上位机利用PC 上 MATLAB 强大的数学计算能力,进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作,根据识别到的不同语音通过 PC 串口向下位机发送不同的 指令。下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,根据不同的指令控制小车完成不同的动作。该设计对语音识别的现有算法进行了验证和实现,并对端点检测和匹配算法进行了些许改进。本设计达到了预期目标,实现了所期望的功能效果。关键词:MATLAB,
3、语音识别,端点检测,LPC,单片机,电机控制 IISMART CAR GASED SPEECH RECOGNITIONABSTRACTWith the development of computer technology,pattern recognition,signal processing technology and acoustic technology etc, the speech recognition system that can meet the various needs of people is more possible to achieve.The past th
4、ree decades, the voice recognition in the field of computer, information processing, communications and electronic systems, automatic control by the speakers speech can be divided into isolated word (Isolated Word) identification, conjunctions (Connected Word) and continuous speech recognition (Cont
5、inuous Speech) identification. Identifying the type of object from the point of view, the voice recognition can be divided into a specific person (Speaker Dependent) speech recognition and non-specific (Speaker Independent) speech recognition. This design uses the identification type is a specific p
6、erson isolated word speech recognition.This design is of a good implementation of speech recognition in the control field, it does the work that would otherwise require manual operation by the voice of people easily.This system includes two major aspects:the the computer which , matching, identifica
7、tion and serial control,then it send different commands through the PC serial port to slave system according different recognised voice. The slave system is a car controlled by a single-chip micro-controller.It controls the car do different actions according different instructions received. The desi
8、gn is checking and realization of the existing speech recognition algorithm and I the endpoint detection and matching algorithms were slight improved.This design achieved the expected goals and achieved the desired functional effect.KEY WORDS:MATLA B,Speech Recognition,Extreme Points Test,LPC,Chip I
9、IIMicrocomputer,Motor DriveIV目 录前 言 .1第 1 章 系统总体设计方案介绍 3第 2 章 上位机设计 42.1 语音识别简介 42.1.1 语音识别发展 42.1.2 语音识别的分类 42.2 声音录入 52.3 声音的预处理 62.3.1 欲加重处理 62.3.2 分帧处理 62.4 端点检测 62.4.1 过零率 62.4.2 音量 72.4.3 过零率和音量积谱 82.4.4 用过零率和音量积谱来检测端点 92.5 特征参数提取 .102.5.1 特征参数概述 .102.5.2 用 MATLAB 实现 LPC 系数的计算 142.6 语音识别中的模式匹配
10、 .142.6.1 DTW 算法原理 142.6.2 程序实现 .162.7 MATLAB 上的 GUI 设计 18第 3 章 下位机设计 .203.1 小车总体设计 .203.1.1 小车总体框图 .203.1.2 小车结构设计 .203.2 小车硬件设计 .203.2.1 单片机电路设计 .20V3.2.2 驱动电路设计 .233.2.3 稳压电路设计 .243.3 小车软件设计 .243.3.1 主程序流程图 .243.3.2 部分主程序 .253.3.3 底层驱动程序 .27结 论 29参考文献 30致 谢 31附 录 321前 言随着计算机技术、模式识别和信号处理技术及声学技术等的发
11、展,使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。当今,语音识别产品在人机交互应用中已经占到越来越大的比例。语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。孤立词识别是指说话人每次只说一个词或短语,每个词
12、或短语在词汇表中都算作一个词条,一般用在语音电话拨号系统中。连接词语音识别支持一个小的语法网络,其内部形成一个状态机,可以实现电话语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音,通常特指用于语音录入的听写机。从识别对象的类型来看,语音识别可以分为特定人(Speak er Dependent)语音识别和非特定人(Speaker Independent)语音识别。特定人是指只针对一个用户的语音 识别,非特定人则可用于不同的用户。实际上,非特定人语音识别的初始识别率往往都比较低,一般都要求用户花一定的时间对系统进行训练,将系统的参数进行一定的自适应调整,才能使识别率达到满意的
13、程度。本设计采用的识别类型是特定人孤立词语音识别。本设计是语音识别在控制领域的一个很好实现,它将原本需要手工操作的工作用语音来方便地完成。本系统分上位机和下位机两大方面。上位机利用PC 上MATLAB 强大的数学计算能力,进行语音输入、端点监测、特征参数提 取、匹配、串口控制等工作,根据识别到的不同语音通过 PC 串口向下位机发送不同的指令。下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,很据不同的指令控制小车完成不同的动作。该设计对语音识别的现有算法进行了验证和实现,并对端点检测和匹配算法进行了些许改进。为了更方便的进行上位机的操作,本设计用 MATLAB的 GUI 设计了一个图
14、形界面。上面设置了串口选择框、录音开始按钮、语音识别结果框等。2下位机采用STC2C5A60S2 单片机作为控制中心,采用 L298 专用驱动芯片搭建双桥,进行点击的正反转调速等控制。本设计达到了预期目标,实现了所期望的功能效果。第 1 章 系统总体设计方案介绍3本系统分上位机和下位机两大方面。上位机利用PC 上 MATLAB 强大的数学计算能力,进行语音的输入、端点监测、特征参数提取、匹配、识别、串口控制等工作,根据识别到的不同语音通过 PC 串口向下位机发送不同的指令。下位机是单片机控制的一个小车,单片机收到上位机传来的指令后,很据不同的指令控制小车完成不同的动作。PC 机和小车之间通过串
15、口无线传输模块进行数据传输。总体框图如图 1-1 所示:图 1-1 系统总体框图第 2 章 上位机设计上位负责语音的识别,并根据识别到的不同结果向下位机(小车)发送不同PC 机(语音识别)语音输入 无线发射无线接收单片机控制中心驱动电路电机4的指令。上位机的设计基于 MATLAB 平台,利用 MATLAB 强大的数学计算能力,进行语音的输入、预处理、端点监测、特征参数提取、匹配、识别、串口控制等工作。2.1 语音识别简介2.1.1 语音识别发展随着时代的发展,人们越来越注重生活的品质。便捷时尚成为当代人们的追求目标。随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的
16、语音识别系统的实现成为可能。近二三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。当今,语音识别产品在人机交互应用中已经占到越来越大的比例。2.1.2 语音识别的分类语音识别按说话人的讲话方式可分为孤立词(Isolated Word)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。孤立词识别是指说话人每次只说一个词或短语,每个
17、词或短语在词汇表中都算作一个词条,一般用在语音电话拨号系统中。连接词语音识别支持一个小的语法网络,其内部形成一个状态机,可以实现简单的家用电器的控制,而复杂的连接词语音识别系统可以用于电话语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音,通常特指用于语音录入的听写机。显然,连续非特定人语音识别的难度要大得多,因为不仅有说话人口音的问题,还有协同发音、断字断句、搜索等问题,除了考虑语音的声学模型外还要涉及到语言模型,如构词法、文法等。从识别对象的类型来看,语音识别可以分为特定人(Speaker Dependent)语音识别和非特定人(Speaker Independent)
18、语音识别。特定人是指只针对一个用户的语音识别,非特定人则可用于不同的用户。实际上,非特定人语音识别的初始识别率往往都比较低,一般都要求用户花一定的时间对系统进行训练,将系统的参数5进行一定的自适应调整,才能使识别率达到满意的程度。非特定人大词表连续语音识别是近几年研究的重点,也是研究的难点。目前的连续语音识别大多是基于 HMM(隐马尔可夫模型 )框架,并将声学、语言学的知识统一引入来改善这个框架,其硬件平台通常是功能强大的工作站或 PC 机。2.2 声音录入本设计利用PC 上的话筒口进行声音录入。通过 MATLAB 的 wavrecord 函数进行声音录入。wavrecord 是MATLAB
19、的专有声音录入函数,他有一下三种调用方式:(1) y = wavrecord(n,Fs)(2) y = wavrecord(n,Fs,ch)(3) y = wavrecord(n,Fs,dtype)其中 n 代表声音录入的总采样数。Fs 代表声音的采样率。ch 代表声音录入采用的通道数,当 ch 为 1时为单声道,当 ch 为 2时为立体声。 dtype代表采样数据的存储类型,MATLAB 提供四种存储类型如下:(1) double (default value), 16 bitssample(2) single, 16 bitssample(3) int16, 16 bitssample(4
20、) uint8, 8 bitssample 本设计单次采样总数为50000点,采样率为 22000HZ。即:y=wavrecord(50000,22000);2.3 声音的预处理2.3.1 欲加重处理预加重的目的在于滤除低频干扰,尤其是 50Hz 或 60Hz 的工频干扰,将对于语音识别更为有用的高频部分的频谱进一步提升。在计算短时能量之前应用该滤波器,还可以起到消除直流漂移、抑制随机噪声和提升清音部分能量的效果。2.3.2 分帧处理6在计算各个系数之前要先将语音信号作分帧处理。语音信号是瞬时变化的,但在 1020ms 内是相对稳定的.我设定的采样频率为 11025 所以我们对预处理后的语音信
21、号 S1(n)以 1024点为一帧进行处理,帧移为 512 个采样点。2.4 端点检测所谓端点检测,就是在实时输入的声音信号中,区分背景噪声和环境噪声,准确地判断出声音信号的开始点和结束点。在语音识别系统中,正确、有效地进行端点检测不仅可以减少计算量和缩短处理时间,而且能排除无声段的噪声干扰、提高语音识别的正确率。研究表明,即使是在安静的环境下,语音识别系统一半以上的错误可能主要来基于MTLAB编写的语音端点检测程序。除此之外, 在语音合成、 编码等系统中,高效的端点检测也直接影响甚至决定着系统的主要性能。因此, 端点检测的效率、 质量在语音处理系统中显得至关重要。2.4.1 过零率过零率(Z
22、ero Crossing Rate)是在每个音框中,音讯通过零点的次数。一般而言,噪声的过零率大于气音的过零率,而气音的过零率又大于有声音的过零率。一半情况下,噪声的波形和声音波形相比幅度非常小,为了排除噪声对过零率产生的影响,我将声音的原始谱向上平移,使得噪声的过零点影响大大减小。如下,图 2-1 展示了没有平移前的过零谱图,图 2-2 展示了平移后的过零谱图。可以看出,平移后,话音可以很容易从噪音中区分开来。0 0.5 1 1.5 2 2.5 3 3.5x 104-2-1012 声声声声0 0.5 1 1.5 2 2.5 3 3.5x 1040200400600 声声声7图 2-1 平移前
23、的过零谱0 0.5 1 1.5 2 2.5 3 3.5x 104-2-1012 声声声声0 0.5 1 1.5 2 2.5 3 3.5x 1040204060 声声声图 2-2 平移后的过零谱2.4.2 音量能量或者音量代表声音的大小,可由声音讯号的震幅来类比,又称为能量(Energy)或强度(Intensity)等。话音的能量远比噪声的能量要大,故可用能量来区分是静音还是由话音。这里将每帧的幅度绝对值之和作为每一帧的总能量大小。音量谱如图2-3 所示:80 0.5 1 1.5 2 2.5 3 3.5x 104-2-1012声 声 声 声0 0.5 1 1.5 2 2.5 3 3.5x 104
24、05001000声 声 声图 2-3 音量谱2.4.3 过零率和音量积谱通常利用短时能量来检测浊音,用过零率来检测清音,两者配合实现可靠的端点检测。端点检测算法常用的是由语音能量和过零率组合的有双门限法,以及短时能量和过零率的乘积构成的能频值法。图 2-4 展示了过零谱、音量谱和过零率和能量成绩构成的谱线。90 0.5 1 1.5 2 2.5 3 3.5x 104-202声 声 声 声0 0.5 1 1.5 2 2.5 3 3.5x 104050声 声 声0 0.5 1 1.5 2 2.5 3 3.5x 10405001000声 声 声0 0.5 1 1.5 2 2.5 3 3.5x 1040
25、24x 104 声 声 声 声 声 声图 2-4 过零音量积谱2.4.4 用过零率和音量积谱来检测端点端点检测算法常用的是由语音能量和过零率组合的有双门限法,以及短时能量和过零率的乘积构成的能频值法。这里采用的是第二种方法,通过能量和过零率的乘积构成的能频值来判断语音的端点。这里我对端点进行了两级判断。首先根据过零率和音量积设定一个较高的门限T H , 若谱大于 T H ,则可确定 2个端点 A、 B, 并可认为这 2 个端点之间是语音信号, 这样相当于完成初判。 再根据背景 噪声的过零率和音量积设定一个比TH 稍低的门限T L , 如果信号的 能量大于 TL ,则所对应的端点 C、 D 之间
26、仍是语音信号,至此完成了第二级判断。判断结果如图 2-5 所示:100 0.5 1 1.5 2 2.5 3 3.5x 104-2-1012 声 声 声 声1.4 1.5 1.6 1.7 1.8 1.9 2 2.1x 104-2-1012 声 声 声 声图 2-5 端点检测出的语音波形2.5 特征参数提取2.5.1 特征参数概述对于特征参数,有多种参数可供选取。常见的有三种:(1)线形预测系数特征矢量(LPC)(2)LPC 倒谱 特征矢量(LPCC)(3)Mel 倒谱系数(MFCC)1. 线性预测系数(LPC)这里我采用最简单的一种线形预测系数特征矢量(LPC)。 线性预测(Linear Pre
27、diction)分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音信号处理领域中得到了广泛的应用。基本思想是:一个语音信号的抽样值可以用过去的若干个抽样值的线性组合来逼近。11语音信号是一种典型的时变信号,然而如果把观察时间缩短到十毫秒至几十毫秒,则可以得到一系列近似稳定的信号。人的发音器官可以用若干段前后连接的声管进行模拟,这就是所谓的声管模型。由于发音器官不可能毫无规律地快速变化,因此语音信号是准稳定的(quasi steady)。全极点线性预测模型(LPC)可以对声管模型进行很好的描述,这里信号的激励源是由肺部气流的冲击引起的,声带可以有周期振动也可以不振动
28、,分别对应浊音(Vowel)和清音(Consonant),而每段声管则对应一个LPC 模型的极点。一般情况下,极点的个数在 1216 之间,就可以足够清晰地描述语音信号的特征了。LPC 是语音分析的重要手段,它能很好地进行谱估计,即可作为语音特征的参数。因此仅用 12 个 LPC系数就能很好地表示复杂语音信号的特征,这就大大降低了信号的冗余度并有效地减少了计算量和存储量,使之成为语音识别和语音压缩的基础。2.11(,0)(,)pnkniai1,2kp上式表示 p个方程构成的方程组,未知数为 p个。求解该方程组,就可以得到系统的线性预测系数。由基于自相关的递推求解公式求解,也就是所谓的Durbi
29、n 算法得:2.2(0)nER2.31()()iijni iajk2.4()iia2.5(1)(1),i ijjijkaji2.6)2lninE公式中,上标表示第 次迭代,每次迭代只计算和更新 直到() 12,ia时,结束迭代。ip在 MATLAB 中利用lpc 函数计算 LPC系数,其语法为:a = lpc(x,n);这里 x 为一帧语音信号,n 为计算 LPC 参数的阶数。通常 x 为 240 点或 256点的数据,n 取 1012,对语音识别来说就已经足够。122. 线性预测倒谱系数(LPCC)在语音识别系统中,很少直接使用 LPC 系数,而是由 LPC 系数推导出另一种参数:线性预测倒
30、谱系数(LPCC) 。倒谱实际上是一种同态信号处理方法,标准的倒谱系数计算流程需要进行FFT 变换,对数操作和相位校正等步骤,运算比较复杂。在实际运作中大多数语音识别系统都会采用倒谱参数来作为有关距离的度量。LPC 倒谱系数是描述说话人声道特性的,广泛应用于声纹识别。在实际计算中,当序列 x(n)为最小相位的情况下,可以利用序列 x(n)及其倒谱系数 c(n)的递推关系来简化计算。序列 x(n)及其复倒谱系数 c(n)的递推公式如下:2.710,0()()nk nxnxkLPCC 参数是一种非常重要的参数,它不是由原始信号 x(n)得到,而是由LPC 系数得到 的。由 2.6 式可得 LPC
31、到 LPCC 的直接递推关系。ma2.820logcG2.91,1mkmcp2.101,kca3. Mel 尺度倒谱系数(MFCC)LPC 模型是基于发音模型建立的,LPCC 系数也是一种基于合成的参数。这种参数没有充分利用人耳的听觉特性。实际上,人的听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的,基本上是一个对数的关系。近年来,一种能够比较充分利用人耳这种特殊的感知特性的参数得到了广泛的应用,这就是 Mel 尺度倒谱参数(Mel-scaled Cepstrum Coefficient),或称 Mel频率倒谱系数,简称为 MFCC。大量的研究表明,MFCC 参数能够比 LP
32、CC 参数更好地提高系统的识别性能。从目前使用的情况来看,在大词汇量语音识别应用中已逐渐取代原本常用的线性预测编码导出的倒频谱参数,原因是它考虑了人类发声与接收13声音的特性,具有更好的鲁棒性。由于语音信号在时域上的变化快速而不稳定,所以通常都将它转换到频域上来观察,此时它的频谱会随着时间作缓慢的变化。所以通常将加窗后的帧经过快速傅立叶变换(FFT) ,求出每帧的频谱参数。再将每帧的频谱参数通过一组 N 个( N 一般为 20 30 个)三角形带通滤波器所组成的 Mel频率滤波器,将每个频带的输出取对数,求出每一个输出的对数能量(log energy)Ek,k =1,2,. N。再将此 N 个
33、参数进行余弦变换(cosine transform) 求出 L 阶的 Mel -scale cepstrum 参数。MFCC 参数的计算是以“bark”为其频率基准的,它和线性频率的转换关系是:2.1110259log()7mel ffMFCC 参数也是按帧计算的。首先要通过FFT 得到该帧信号的功率谱 ,转()Sn换为 Mel 频率下的功率谱。这需要在计算之前先在语音的频谱范围内设置若干个带通滤波器:2.12(),0,1,0,12mNHnMn MFCC 参数的计算通常采用如下的流程:(1)首先确定每一帧语音采样序列的点数。对每帧序列 进行预加重()sn处理后再经过离散 FFT 变换,取模的平
34、方得到离散功率谱 。()S(2)计算通过 M 个后所得的 功率值,即计算和在()Sn()mHnmH各离散频率点上乘积之和,得到 M 个参数 , 。mP0,1M(3)计算的自然 对数,得到 , 。mPL0,1(4)对计算其离 散余弦变换,得到 , 。011,L D,1(5)舍去代表直流成分的 ,取作为 MF CC 参数。0D12,K2.5.2 用 MATLAB 实现 LPC 系数的计算本系统使用的特征参数是线性预测系数(LPC)。在 MATLAB 中利用lpc 函数计算 LPC系数,其语法为:a = lpc(x,n);这里 x 为一帧语音信号,n 为计算 LPC 参数的阶数。通常 x 为 240
35、 点或 25614点的数据,n 取 1012,对语音识别来说就已经足够。2.6 语音识别中的模式匹配2.6.1 DTW 算法原理目前,语音识别的匹配主要应用 HMM 和DTW 两种算法。DTW 算法由于没有一个有效地用统计方法进行训练的框架,也不容易将低层和顶层的各种知识用到语音识别算法中,因此在解决大词汇量、连续语音、非特定人语音识别问题时较之HMM 算法相形见绌。HMM 是一种用参数表示的,用于描述随机过程统计特性的概率模型。而对于孤立词识别,HMM 算法和 DTW 算法在相同条件下,识别效果相差不大, 又由于 DTW 算法本身既简单又有效,但 HMM 算法要复杂得多。它需要在训练阶段提供
36、大量的语音数据,通过反复计算才能得到参数模型,而 DTW 算法的训练中几乎不需要额外的计算。鉴于此,DTW 更适合本系统的要求。 在孤立词语音识别中,最为简单有效的方法是采用 DTW(Dynamic Time Warping,动态时间归整)算法,该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。用于孤立词识别,DTW 算法与 HMM 算法在训练阶段需要提供大量的语音数据,通过反复计算才能得到模型参数,而 DTW 算法的训练中几乎不需要额外的计算。所以在孤立词语音识别中,DTW 算法仍然得到广泛的应用。 无论在训练和建立模板阶段还是在识
37、别阶段,都先采用端点算法确定语音的起点和终点。已存入模板库的各个词条称为参考模板,一个参考模板可表示为R=R(1) ,R(2) ,R(m) ,R(M),m 为训练语音帧的时序标号,m=1 为起点语音帧,m=M 为终点语音帧,因此 M 为该模板所包含的语音帧总数,R(m)为第 m 帧的语音特征矢量。所要识别的一个输入词条语音称为测试模板,可表示为 T=T(1) ,T(2) ,T(n) ,T(N),n 为测试语音帧的时序标号,n=1 为起点语音帧,n=N 为终点语音帧,因此 N 为该模板所包含的语音帧总数,T(n)为第 n 帧的语音特征矢量。参考模板与测试模板一般采用相同类型的特征矢量(如 MFC
38、C,LPC 系数) 、相同的帧长、相同的窗函数和相同的帧移。 假设测试和参考模板分别用 T 和 R表示,为了比较它们之间的相似度,可以15计算它们之间的距离 DT,R,距离越小则相似度越高。为了计算这一失真距离,应从 T 和 R中各个对应帧之间的距离算起。设 n 和 m 分别是 T 和 R中任意选择的帧号,dT(n) ,R(m)表示这两帧特征矢量之间的距离。距离函数取决于实际采用的距离度量,在 DTW 算法中通常采用欧氏距离。 若 N=M 则可以直接计算,否则要考虑将 T(n)和 R(m)对齐。对齐可以采用线性扩张的方法,如果 N1 D2 = D(i-1,j-1); else D2 = rea
39、lmax; end if j2 D3 = D(i-1,j-2); else D3 = realmax; end D(i,j) = d(i,j) + min(D1,D2,D3); end end 18dist = D(n,m);elsedist=realmax;End2.7 MATLAB 上的 GUI 设计MATLA作为功能强大的科学计算软件,同样也提供了图形用户界面设计的功能。在 MATLAB 中,基本的图形用户界面对象包括三类:用户界面控件对象,下拉式菜单对象和快捷菜单对象。根据这些图形对象,可以设计出界面友好。操作方便的图形用户界面。本系统的整个上位机使用 MATLAB 做的,为了更方便的
40、进行操作,我用MATLAB 的 GUI 设计了一个图形界面。上面设置了串口选择框、录音开始按钮、语音识别结果框等。实际界下面如图 2-6 所示:图 2-6 MATLAB-GUI 界面19第 3 章 下位机设计3.1 小车总体设计3.1.1 小车总体框图系统总体框图如下所示。整个系统以单片机作为控制中心,单片机前要接受上位机传来的控制指令,后要根据收到的指令控制小车完成不同的功能。小车共有两个电机,有 L298构成的 H 桥来驱动。稳压电路采用线性稳压芯片 7805 来完成。系统框图如图 1-1 所示:单片机控制核心串口接收 L298 电机驱动电路20图 3-1 系统总体框图3.1.2 小车结构
41、设计本小车底盘采用三轮结构,两个动力轮分别由两个直流电机单独驱动。第三个轮是转向轮,可以三百六十度转向。核心板采用通用板搭建,采用专用芯片插槽,方便单片机的拆卸。驱动电路和稳压电路焊在同一通用板上,两个板子用铜柱固定为上下两层,节省空间。整个小车实物图见附录一。3.2 小车硬件设计3.2.1 单片机电路设计本系统单片机采用的是宏晶公司的STC12C5A60S2,它采用增强型 8051内核。指令代码完全兼容传统8051 单片机,但速度比传统 8051单片机快 8-12 倍。单片机控制电路主要有复位电路、晶体振荡电路两部分。其总体电路图如图 3-2 所示:电机21图 3-2 单片机电路图1. 复位
42、电路复位电路是单片机控制电路中很重要的电路之一。STC12C5A60S2 单片机为高电平复位,及即要使得复位管脚 RST 保持一定时间的高电平。其复位电路分两种情况。当单片机时钟频率小于12MHZ时,采用第一种复位电路。将 RST 管脚接 1K 电阻 R1 到地,其电路如图3-3 所示。图 3-3 第一复位电路当单片机时钟频率大于12MHZ时,采用第二复位电路,其电路如图3-4 所示。图 3-4 第二复位电路本电路单片机时钟采用的是 12MHZ,故复位电路采用第二种。以上复位电路只能保证单片机能够上电复位,为了更好的进行调试,本电路对上面的电路进行了更改,使得单片机电路能够手动复位。改进后的复
43、位电路如下图 3-5 所示。当按键按下时,由于电阻 R1 的作用,RST 管脚保持为高电平。单片机复位。22图 3-5 改进后的实际复位电路2. 晶振电路STC12C5A60S2 单片机内部含有 RC 时钟振荡电路,单片机可以选择使用内部自有的 RC 时钟振荡电路,也可以使用外接的高精度晶体时钟。用户在下载用户程序时,可选择是使用内部 RC振荡器还是外部晶体时钟。常温下内部时钟频率为5V 单片机:1117MHZ,3.3V 单片机:812MHZ。单片机内部时钟电路受温漂等影响较大,当对精度要求不高时可以使用内部时钟。本电路需要串口数据收发,控制对时钟要求较高,故采用的时钟源是外接的高精度晶体时钟
44、。其电路如图3-6 所示。图 3-6 晶体振荡电路3.2.2 驱动电路设计驱动电路的选择及稳定性对小车性能来说是至关重要的。这里我采用L298 专用驱动芯片来驱动两个直流电机。L298 驱动芯片内置两个 H 桥电路,可以两个电机实现正转和翻转。最大输出电流可以达到两安,这对小车上的直流电机足够用。23L298 的外围电路也是非常重要的,图 3-7 为 L298 的外围电路。途中 8 个单向导通二极管起着非常重要的作用,它可以防止电机磁场作用产生很大的反向电压时对 L298 内部电路的破坏作用。图 3-7 L298 外围电路3.2.3 稳压电路设计小车的整个硬件电路共需要两个电压,电源电压为8
45、伏,直接供给直流电机。而单片机控制电路需要五伏的电压,故需要设计一个稳压电路来输出稳定的 5 伏电压供给单片机控制电路。本系统采用线性稳压芯片 7805把 8 伏的电源电压稳成5 伏输出。其电路图如图 3-8 所示:图 3-8 5V 稳压电路3.3 小车软件设计LM7805Vin Vout=5V243.3.1 主程序流程图图 3-9 主函数流程图小车单片机采用 STC12C5260S2,此单片机属于 8051内核,采用 KEIL 开发环境来编程。下位机程序主要功能就是时刻准备接受上位机传来的串口数据,然后,根据不同的数据控制小车电机是小车完成不同的动作。主函数流程图如图 3-9 所示:3.3.
46、2 部分主程序部分程序如下:#includereg52.()Com_Init();while(1)switch(RxBuf0)case 1:系统初始化前进 停止 后退串口数据125go_ahead();break;case 2:stop();break;case 3:go_afterward();break;default :;3.3.3 底层驱动程序底层驱动程主要分两块儿:电机控制程序和串口控制程序。串口控制主要是进行寄存器设置,设置串口时钟得喝波特率。串口数据的接收程序有查询法和中断法。查询法主要是通过不断查询串口数据接收标志位,当标志位置位时,说明串口数据接收缓冲区已满,于是就可以把数据从接收缓冲区中读出,其流程图如图 3-10。中断的方法是,打开单片机硬件串口中断,串口数据接收缓冲区已满时,单片机就会触发串口中断,通知 CPU读取串口接收的数据。中断的方法可以减少CPU 占用率,故这里我采用了中断的方法。RI= =1YNRI=0;读取串口数据开始