1、深度学习视阈下的英语发音质量和语音识别探微 单敏 无锡机电高等职业技术学校 摘 要: 随着社会主义市场经济发展水平的不断提升, 教育事业逐渐被推入到新型历史时期之中。英语科目指导教学的开展与学习, 逐渐成为教师日常工作的重点与难点。本文将深度学习作为主要的课题研究视角, 结合神经网络数据模型构建的相关内容, 将有关英语发音质量评价, 以及语音识别实验工作的开展与实验结果, 进行了详细的分析和论述, 望能够帮助社会成员提升英语发音的质量。关键词: 深度学习; 英语; 发音质量; 语音识别; 作者简介:单敏 (1982) , 女, 江苏无锡人, 研究方向:英语和语音识别探微。收稿日期:2017-8
2、-14基金:2012 年无锡机电高等职业技术学校校级课题“高职英语课程服务职校国际交流的实践与探索” (项目题编号:锡机电研 1217) Exploration of English Pronunciation Quality and Speech Recognition from the Perspective of Deep LearningSHAN Min Wuxi Machinery and Electron Higher Professional and Technical school; Abstract: With the development of the socialist
3、 market economy, the education has been pushed into the new historical period. The development and study of English subject instruction has gradually become the focus and difficulty of teachers daily work. This paper makes deep learning as the main research perspective, relevant content construction
4、 combined with neural network data model, the English pronunciation assessment and speech recognition, experimental work and experimental results are analyzed and discussed in detail, and it hopes to be able to help the social members to improve the quality of English pronunciation.Keyword: deep lea
5、rning; English; pronunciation quality; speech recognition; Received: 2017-8-14前言在各种新型科技信息技术手段的应用模式普遍性推广的同时, 英语逐渐成为世界范围内各个国家经济往来, 以及文化信息交流活动之中, 应用频率最高的语言种类之一。在国内社会成员自身物质生活诉求得到充分满足过后, 英语语言相应知识内容的学习与讲解, 逐渐受到各个生产领域工作人员的高度重视。有关在深度学习视角下, 英语发音质量以及语音识别的研究, 就是在这一社会背景下产生的。一、简析英语语音识别神经网络模型的相关内容(一) 语音神经网络识别的基本概
6、念所谓语音神经网络识别的技术手段, 其实际上指的就是人工智能技术手段支持下被广泛应用的神经网络信息处理系统。有部分语音神经元研究领域的专业工作人员, 也习惯将这一新型网络信息处理技术的应用, 称之为是神经网络的独立处理单元。各个分化功能板块之间的信息传输以及功能的衔接, 均通过独立神经元的信息处理系统之间的相互协作得以实现。将信息存储于神经元系统的核心电子芯片之中, 通过对人脑信息处理模式的模拟化构建, 实现抽象信息内容向具体传递形式的编码转换。通过进行非线性信息编码转换的方式, 尽可能提升信息内容传递与处理的执行效率, 是模拟发音神经网络在正常运行状态下, 严格遵循的基本工作原理。由于相比传
7、统信息传递与处理模式的应用, 神经元智能信息处理网络的构建存在大量较为突出和显著的应用优势。(二) 深度学习神经网络的详细介绍深度学习的神经网络信息传递处理系统的构建, 是在传统神经元模拟信息处理系统应用模式的基础之上, 进行进一步的完善和发展而得到的。在英语语音发音质量以及语音信息识别鉴定的应用环节内, 相应英语语音学习和教学的系统结构, 会逐渐呈现出多层次化的发展模式。有教育研究领域英语专业的从业教师, 在结合深度学习神经元构建模式的基础之上明确指出, 这一网络构建的主要模式是一种基于自主学习状态下, 无监督学习种类的归属教育类型之一。为保障深度学习多层次化网路构架, 在实际应用过程之中体
8、现的系统优势.系统层次构架的具体数量, 应当保持在至少七层以上的构建模式之内。在全面结合低层次信息处理的数据结果的基础之上, 将转码过后的英语语音识别信息归属到更加抽象的属性类别范畴之中。在必要时, 工作人员还可以通过应用数据分散式布局的统计方式, 提升深度学习神经元网络构架系统的应用效率。经过同领域专业技术人员长时间的尝试和探索, 对新型深度学习神经网络构建模式的实质内容, 得出了系统化理论化的研究结论。专业研究人员认为, 所谓深度学习视角下神经网络信息处理模式的应用, 其实质上指的就是通过结合应用多层次化的机械学习设备, 帮助指定服务教导对象, 进行在英语语音识别以及发音训练方面的强度练习
9、。通过提升语音发音训练的管理强度, 在了解学生语音学习认知规律的基础之上, 更好地提升了对语音发音学习效果的认知能力。在整个深度语音发音质量以及识别系统构建应用的教育流程之中, 深度模型的构建是系统运行讲解的主要方式。帮助学生在结合英语发音特点基础上进行合理化语音发音的训练和学习, 是深度学习构架模式最为主要的教学应用目标。二、英语发音质量和语音识别的评价(一) 深度学习视角下, 英语发音质量的评价过程根据深度学习视角下, 英语发音质量评价工作的开展, 其实践出发点和认知角度的各不相同。相应发音质量评价工作开展的存在类型, 可以进一步划分为主观评价和客观评价两种各不相同的存在形式。所谓英语发音
10、质量中的主观评价, 其实际上指的就是语言表述专家根据自身累积的专业发音涵养, 对指定评价对象英语语音发音方式的准确程度开展的评价活动。这一形式发音质量评价工作的开展, 在通常情况下要严格遵循评定人员自身的认知印象。通过对语音发音课件的音质质量进行测试。考核者根据自身累积的发音认知, 对考核对象的英语语音进行比较和评价。综合评价过程之中得出的各种差异结论, 给出不同数量的综合评定分数。客观评价是在主观评价活动开展形式的基础之上, 形成的一种英语语音发音质量的评定方式。与主观评价工作的开展途径存在较大的差异, 客观评价工作的实施, 需要借助不同形式的机械评价设备。往往在自动客观性发音质量评价工作开
11、展的实践环节内, 各种评价所得分数的统计与设定, 均控制在人工智能化信息系统运行的审核模式之下。相比主观评价中判断误差出现的频率, 客观评价模式的应用往往能够更加深入的体现发音质量审核的公正性。所得质量高低与否的评价结果, 也能够更好地满足各大录取机构和考试主办方的评定需求。(二) 英语发音质量的评价标准无论是应用主观评价方式, 还是应用客观的发音质量评价途径, 相应评价活动的开展均需要构建在规范统一的指导标准之下。各项评价标准的设定, 要建立在英语语言学的研究视角之上。将英语发音的韵律节奏、音准程度、音长控制力度等, 都囊括到英语发音质量评价工作开展的考量范围之中。不仅英语发音之中的因素构成
12、模式可以作为音准评价的参照标准, 对于英语发音过程之中轻重缓急音律节奏的控制, 在评价过程之中也需要做出全面的考虑。在通常情况下, 英语各种因素的发音根据语音缓急通读方式的不同, 可以划分为部分重读、完全重读, 以及全部轻度的三种节奏韵律控制方式。发音被核定对象通过对三种英语音素轻重发音模式的灵活转换, 更好的表达出自己所要表达的情感信息。进入到二十一世纪过后, 世界范围内有关英语发音质量评价指标设定工作的研究, 已经基本形成了规范化和统一化的工作标准。各项评价指标的设定, 已经逐渐进入到趋于完善的发展高度之上。(三) 英语语音识别的评价过程鉴于各个教育阶段之中学习主体性格认知能力的各不相同,
13、 对小学、中学以及大学学生主体英语发音质量评价工作的开展, 需要结合不同的评价要求和参照指标。但无论是应用于哪一种教育阶段之中的英语发音质量的评价模式, 均应当同时涵盖对发音音准程度、发音语速的缓急程度节奏快慢的控制力度等, 只是在相应考核对象的要求高度方面, 应当根据英语发音考核主体实际年龄层段所处, 实际认知能力强弱水准的各不相同做出适当的调整。截止到 2016 年年终, 国家发改委相关部门的工作人员对国内多个生产领域开展的信息化手段应用覆盖率的抽样调查。所得调查结果显示, 目前国内智能神经元网络信息处理技术, 已经以英语语音识别评价的独有存在形式, 广泛应用在科目语言教育的实践环节内。从
14、二十一世纪初期开始, 英语教育研究领域的工作人员, 开始提出将语音神经元识别系统全面结合应用到英语教学与学习工作开展的过程之中。经过十几年时间的发展, 这一设想理论的提出, 已经在两代技术人员坚持不懈的努力下, 取得了一定数量的应用成效。语音传递连接设备的应用、加法器件的结合, 以及激励函数数值方程式的结合构建等等, 都是当下国内发音神经网络识别技术, 在系统构建的实践性评价工作的流程之中, 所必须具备的三相构成要素。例如, 大学生教育主体英语发音质量评定指标的设定, 应当明显高于相应评价体系对高中在校学生英语发音质量的要求高度。在此基础之上, 技术研发人员还需注意的是, 相应系统智能神经元评
15、价模式的构建, 也需要建立在多层次全方位考量的发展视角之上。只有尽可能实现系统构建的层次化评定模式, 才能更好地保障评价结果所得数据信息的精准度, 否则甚至可能得到适得其反的系统应用效果。三、英语发音质量和语音识别系统构建的引用优势相比传统英语发音教学模式的应用, 深度语音识别网络构建模式的应用, 具有几项较为突出和显著的应用优势。首先, 相比单一层次划分方式的传统神经元模拟信息处理系统, 深度学习英语语音模型系统信息处理模式的构建, 拥有更加多样化的层次划分方法。在一般情况下, 深度学习语音神经元模拟信息处理系统的构建, 均拥有五六层甚至多达十多层的信息层次划分数量。每个信息处理层次之中有关
16、节点信息传递模式的构建, 均采用更加简单和少量的参数表现形式。其次, 相比传统能够广泛应用与社会各个生产领域的神经元信息处理系统, 新型深度英语语音识别以及数据处理系统的构建, 具有更加清晰明了的指向性。相信在未来社会的发展历程之中, 英语发音质量和语音识别系统构建的应用, 将凭借其凸显的应用优势, 赢得更多教育领域英语教师的追捧和认可。识别系统构建所取得的应用, 也将为学生英语发音质量的提升, 提供强有力的推动性影响作用。结论总而言之, 在现代化计算机信息处理技术手段的帮助下, 英语发音质量评价以及语音识别的深度学习, 找到了能够促进其飞速发展的研发核心。目前国内同领域的技术工作人员, 在结
17、合发音神经网络识别系统构建的基本概念的基础之上, 建设研发了深度学习神经网络的系统构造模式。技术人员只有在结合相应实验所得数据的基础之上, 才能对英语发音质量在深度学习视角下的构架效果做出客观的判断。参考文献1权成伟, 郭晓晖.影响英语专业学生英语发音的因素探究以河南科技大学外国语学院英语专业为例J.信阳农林学院学报, 2016 (4) :121-123. 2乔治欧尼尔.英语作为国际通用语视角下的华人和日本人之间的英语交流活动中的发音可理解性和音段音位修复策略 (英文) J.Chinese Journal of Applied Linguistics, 2016 (4) :379-400, 498. 3张璐, 李冉.陕西方言对英语语音习得影响的实证研究以陕西工院为例J.湖南税务高等专科学校学报, 2016 (1) :38-39.