收藏 分享(赏)

宗华开题报告.doc

上传人:dreamzhangning 文档编号:2833112 上传时间:2018-09-28 格式:DOC 页数:6 大小:43KB
下载 相关 举报
宗华开题报告.doc_第1页
第1页 / 共6页
宗华开题报告.doc_第2页
第2页 / 共6页
宗华开题报告.doc_第3页
第3页 / 共6页
宗华开题报告.doc_第4页
第4页 / 共6页
宗华开题报告.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、徐州师范大学物理系本科毕业论文(设计)开题报告题 目:基于支持矢量机的声调识别学 生 姓 名 宗华 学 生 学 号 02221152 所 学 专 业 电子科学与技术 班 级 2002(3) 指 导 教 师 顾 明 亮 1一、选题目的、意义及研究现状声调是汉语的主要特征之一,不同的声调和音节的组合代表不同的含义,对应着不同的汉字。汉语的有调音节有 1300 个左右,如果除去四声由声母和韵母组成的无调音节只有 400 多个,同时它又是连续语音切分的有力手段,在连续语流中声调组合及其模式对于提高单词和单句识别率及语音理解必不可少的;在语音识别中加入声调信息可大大减少搜索空间,提高语音识别的精度和速度

2、;在语音合成中它是主要的韵律参数,对合成语音的自然度有重要影响;在汉语语音信号处理的各个领域,无论是识别、编码还是合成,确定一个音节的四声都是至关重要的任务。上个世纪二三十年代刘复先生首先用浪纹计研究汉语声调,得到声调的音高 F0 曲线,1924 年出版了四声实验录 ;他发明的“乙一声调推断尺”和“乙二声调推断尺” ,为汉语声调研究提供了测量手段。几乎在同时,方言大师赵元任先生在清华学报上发表文章,阐述汉语声调是音高频率的变化;他用简单乐管和音高管来模拟声调的音高,确定声调的调值,并创造了五度标记法。八十年代中期以后随着 HMM 的提出,国外的语音识别系统的突飞猛进刺激了国内语音识别研究的普遍

3、展开,利用汉语声韵的特点,在声韵切分,端点检测和声调识别等方面做了大量工作。清华大学的黄泽镇和杨行峻最早在声学学报上发表了汉语普通话孤立字四声的一种模式识别方法;同时 W.J.yang,J.C.Lee,Y.C.Chang等人在 IEEE 发表了基于 HMM 汉语普通话声调识别;还有哈尔滨工业大学赵春霞和徐近霈提出以多级逼近截取有效调型的基音检测器,并利用基音特征参数进行声调识别的方法;以及东南大学陈永彬和关存太的非特定人的曲线拟合的四声识别和张晓东和韦岗的基于最小二乘法的汉语声调判决。进入 90 年代,人工神经网络进入第二次研究高潮,其独特的并行处理优点促进了语音识别发展的同时也给声调识别研究

4、带来新的发展方向。这一时期以中科院自动化所的黄泰翼和杨志伟为代表,他们提出了一种基于多层前向神经网络和 BP 算法的汉语声调识别新方法,该方法对于特定人四声识别率达 99%以上,完全达到实用。同时随着神经网络的不断发展,新型的神经网络被提出并应用于声调识别中,2如上海交大电子工程系的胡光锐和孙放提出的新型前向神经网络用于声调识别研究。近十年兴起的小波理论为语音信号处理提供了新的途径,也为声调识别提供了新的研究方法。如西安电子科技大学的赵瑞珍、屈汉章和宋国乡提出的基于小波变换的汉语声调识别新方法。目前声调识别的方法有基于隐马尔科夫模型方法、神经网络识别方法和小波变换方法等。尽管隐马尔科夫模型能有

5、效提取时序特征,但非线性分类能力不足;神经网络虽具有自学习能力和非线性分类能力,但同样会遇到一些如如何确定网络结构、过学习和欠学习以及局部极小点等问题;支持矢量机是上个世纪 90 年代由 Vapnik 等人根据统计学习理论提出的一种新的学习方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的性能。与传统学习方法相比,它的最大特点是基于结构风险最小化原则,提高学习机的推广能力。3二、毕业论文(设计)的主要内容本论文研究了基于孤立字的汉语声调识别问题,提出了几种不同的特征提取的方法,着重介绍了基于支持矢量机的汉语声调识别方法问题,并通过实验验证不同的算法对声调识别的影响。第二部分介绍了几

6、种基因频率的提取的方法,提出了加权自相关法并以孤立字实验验证算法。第三部分研究了基于支持矢量机的声调识别问题。在这一部分首先介绍了支持矢量机的基本原理和分类,提出了基于支持矢量机的声调识别方法,最后建立语音库以孤立字实验为例进行了验证。第四部分是论文的总结和展望。首先回顾了本论文研究的内容,接着对未来的研究工作进行了展望。三、毕业论文(设计)的进度安排第一阶段: 2005.12.82006.1.8 调研、收集、阅读资料,进行资料分析,初步确定研究毕业论文(设计)的具体题目。第二阶段:2006.2.202006.3.8 交开题报告第三阶段:2006.3.92006.5.1 采集语音,调试 MET

7、LAB 程序实现识别结果并分析第四阶段:2006.5.82006.5.22 论文并修改第五阶段:2006.5.242006.6.3 交论文并做幻灯片4四、参考文献1 W.J.Yang, J.C.Lee , Y.C.Chang, H.C.Wang, Hidden markov model for mandarin lexical tone recognition. IEEE Trans, on ASSP, 1988, 36(7):988-992.2 N.Thubthong, B.Kljsirikul, Support vector machines for Thai phoneme recogn

8、ition. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol.9,No.6 (2001) 803-8133 Peng. G., Wang, W.S.-Y, Tone recognition of continuous Cantonese speech based on support vector machines, Speech Communication 45 (2005) 49-62. 4 石锋,廖荣蓉, 语音丛稿 ,北京语言学院出版社,19945 黄泽镇,杨行峻, “普通话孤

9、立字四声的一种模式识别方法” ,声学学报,1999,15(1):36-43。6 赵春霞,徐近霈, “一种汉语单音节基音提取与声调识别方法” ,应用声学,1988,9(3):31-37。7 关存太,陈永彬, “非特定人四声识别” ,声学学报,1993,18(5):379-385。8 张晓东,张建新,韦岗, “基于最小二乘法的汉语声调判决” ,安徽教育学院(自然科学版) ,1998 第 2 期:10-11。9 孙放,胡光锐, “一种新型前向神经网络用于汉语四声识别” ,上海交通大学学报,1997,31(5):36-38。10 赵瑞珍,宋国乡,屈汉章, “基于小波变换的汉语声调识别新方法” ,信号处理,2000,16(4)357-361。11 赵力, 语音信号处理 ,机械工业出版社,2003。12 边肇祺,张学工,模式识别,清华大学出版社 2000年第二版.13 刘卫国,陈昭平,张颖, MATLAB 程序设计应用 ,高等教育出版社,2002。5五、指导教师意见指导教师签字:年 月 日六、院系毕业论文(设计)领导小组意见 领导小组组长签字:年 月 日

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报