基于SVM的无参考译文.ppt-道客多多

资源描述

1、基于SVM的无参考译文的译文质量评测,宁伟季铎蔡东风报告人：宁伟沈阳航空工业学院知识工程中心,主要内容,问题的提出本文的方法实验及实验结果分析结论,问题的提出,翻译的发展评测的重要性评测的定义 EAGLES(Expert Advisory Group on Language Engineering Standards)(O，U ) VO 是对象的集合U 是用户的集合V 是值的集合,评测的实现手段人工评测自动评测,人工评测指标流畅度忠实度正确性人工评测特点准确可信周期长、成本高、不可复用、主观性强,自动评测给定参考译文（标准答案），通过比较待测译文和参考

2、译文的相似程度判断；相对于人工评测，自动评测最大的特点就是效率高，可复用，可以统一标准；准确性差，可信度小；需要参考译文。,评测的目的和要求精确评测打分，并指出错误点；定性的评价译文好坏。本文出发点对译文进行定性的评测而非精确的质量评价；对象机器辅助翻译的结果；采用机器学习的方法。,SVM(Support Vector Machine),Vapnik 于 1995年提出的支持向量机以训练误差作为优化问题的约束条件，以置信范围值最小化作为优化目标，即SVM是一种基于结构风险最小化准则的学习方法。目标：找到一个超平面，使得它能够尽可能多的将两类数据点正确的分开，同时使分开的两类

3、数据点距离分类面最远。,SVM 是从线性可分情况下的最优分类面发展而来的, 基本思想可用下图的两维情况说明。,图中, 方形点和圆形点代表两类样本, H为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。推广到高维空间，最优分类线就变为最优分类面。,SVM特点,非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射；对特征空间划分的最优超平面是SVM的目标,最大化分类边界的思想是SVM方法的核心；支持向量是SVM

4、的训练结果,在SVM分类决策中起决定作用的是支持向量。,由于SVM 的求解最后转化成二次规划问题的求解，因此SVM 的解是全局唯一的最优解 SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中.,本文方法,借鉴人工打分的方法对句子按照错误类型进行分类不同的错误类型给定不同的扣分权重,实验,流程语料处理-错误标记的处理特征选择训练SVM分类器打分,训练语料 “The practical new-type invention discloses a kind of digital channel the device incl

5、udes , and on both ends of the pulse generator, the power supply is linked, and the pulse signal that is produced by the 脉冲 generator is under the control of the controller, by the pulse transformer, it gets the faradic electricity pulse; after dressing by the wave, it is contributed to the pulse ou

6、tput electrode.”。,错误类型多词错误少词错误非翻译规范错误表达不够流畅语法错误,特征选择,浅层词法特征词、词性 N-Gram 句子perplexity 低概率及未出现Trigram 错误词性模板从带错误标记的语料中抽取一个错误词性模板库These carts run on the stair sections.DT NNS VB IN NN NNS. IN DT NN ADD,深层句法特征浅层句子模板句法树第一层短语模板 NP VP PP 模板库错误句法模板错误标记所在的根节点的孩子节点,sections,stair,S,NP,VP,DT,NNS,VB,

7、PP,these,carts,run,IN,NP,on,NP,NN,NNS,例如：,These carts run on the stair sections,sections,stair,S,NP,VP,DT,NNS,VB,PP,these,carts,run,IN,NP,on,NP,NN,NNS,浅层句子模板：S-NP+VP 短语模板模板：NP-DT+NNS PP-IN+NP 错误词性模板：IN DT NN ADD 错误句法模板：PP-IN+NN+NNS,实验语料,语料-专利摘要训练语料 8,000篇质量好的译文 5,000篇质量较差的译文测试语料 1000篇,实验结果,译文定性评测

8、语言模型 SVM,实验分析,从实验结果可以看出，本文的评测方法可以在一定程度上反映译文的质量，并且和人工评测结果有一定的相关性，但是其正确率还不是很理想，分析原因包括以下几点：在特征选取时，本文仅根据频率对模板进行cutoff，可能会丢失一些重要特征；译文中存在的错误对句法分析结果有一定的影响；语料规模的限制，数据稀疏现象还比较严重；训练语料是人工标注的，虽然本文在实验中已经对标记进行了预处理，但是仍然存在着一些不规范的标记。,结论与展望,译文质量自动评测需要从流畅度、正确性和忠实度三个方面综合考虑，涉及语法知识和语义知识，是一个很有研究意义但解决难度较大的研究课题。本文在无参考译文的情况下，采用机器学习的方法对译文质量进行评测，实验中采用翻译公司审校过的译文做训练和测试语料，并且错误是由专门的审校人员手工标注的，语料具有很高的可信性和说明性，实验结果表明该方法和人工评测结果有一定的相关性。但本文的实验结果还不是很理想，下一步打算从语料的规模以及语料错误标记的规范化处理方面进行改进，而且如何降低句法分析错误对特征选取的影响也是需要考虑的。,Thank you ,

展开阅读全文