当前位置：和泉文库 > 电气与自动化 > 浏览文档

【学术论文】引入复述技术的统计机器翻译研究综述

文件格式：PDF，文件大小：1.01MB，售价：3.51元

文档详细内容（约9页）

第8卷第3期智能系统学报 Vol.8 No.3 2013年6月 CAAI Transactions on Intelligent Systems Jun.2013 D0I:10.3969/i.issn.1673-4785.201211023 网络出版地址：http://www.cnki.net/kcms/detail/23.1538.TP.20130515.0927.005.html 引入复述技术的统计机器翻译研究综述胡金铭2，史晓东12，苏劲松3，陈毅东12 (1.厦门大学信息科学与技术学院，福建厦门361005：2.厦门大学福建省仿脑智能系统重点实验室，福建厦门 361005;3.厦门大学软件学院，福建厦门361005) 摘要：基于对引入复述技术的统计机器翻译研究现状的分析，提出具有研究价值的课题方向.首先归纳了复述的概念，总结了引入复述技术的统计机器翻译各类方法.然后对复述知识在统计机器翻译中的模型训练、参数调整、待译语句改写和机器翻译自动评测等方面应用的主流方法进行了概括、比较和分析，说明了复述与统计机器翻译是紧密相关的，强调了复述在统计机器翻译应用中的关键问题是复述的正确性和多样性最后指出提高复述资源的精确度、建立复述与机器翻译的联合模型、采用新方法解决稀疏问题等是有待进一步研究的课题。关键词：复述技术：机器翻译：统计机器翻译中图分类号：TP391文献标志码：A文章编号：1673-4785(2013)03-0199-09 中文引用格式：胡金铭，史晓东，苏劲松，等.引入复述技术的统计机器翻译研究综述[J].智能系统学报，2013,8(3)：199-207 英文引用格式：HU Jinming,SHI Xiaodong,SU Jinsong,etal.A survey of statistical machine translation using paraphrasing tech nology[J].CAAI Transactions on Intelligent Systems,2013,8(3):199-207. A survey of statistical machine translation using paraphrasing technology HU Jinming'2,SHI Xiaodong'2,SU Jinsong,CHEN Yidong'2 (1.School of Information Science and Engineering,Xiamen University,Xiamen 361005,China;2.Fujian Key Laboratory of the Brain-like Intelligent Systems,Xiamen University,Xiamen 361005,China;3.College of Software,Xiamen University,Xiamen 361005,China) Abstract:In this paper,the research team discussed possible new prospective research directions of paraphrasing technology in statistical machine translation (SMT),based on reviews of state-of-the-art technology.First the re- search team introduced the concept of paraphrases,and next a summarization of the latest progress utilizing para- phrasing technology in SMT was conducted.Finally,conclusions were drawn,data was compared and an analysis of the main issues of incorporating paraphrases into SMT,including translation model training,parameter tuning,in- put sentences rewriting and machine translation evaluation was performed.The results proved that there is an inher- ent connection between paraphrasing and SMT.The results also point out that the correctness and diversity of para- phrasing are the key issues to apply paraphrasing to SMT.It was highly noted that the improvement in the quality of paraphrasing resource,the establishment of a joint model of paraphrasing and machine translation and the new pro- posed approach to solve data sparseness are problems which need further study. Keywords:paraphrasing technology;machine translation;statistical machine translation 机器翻译(machine translation,MT)是利用计算翻译.它属于计算语言学(computational linguistics) 机程序，实现从一种自然语言到另一种自然语言的的范畴.经过数十年的研究，机器翻译在理论和实践方面都有了较大的进步.从方法论的角度来看，目前收稿日期：2012-11-16.网络出版日期：2013-05-15. 的主流研究使用基于统计的方法.统计机器翻译基金项目：国家科技支撑计划资助项目(2012BAH14F03):国家自然科学基金资助项目(60573189,61005052)：福建省自然科 (statistical machine translation,SMT)是通过对大量学基金资助项目(20060043) 通信作者：史晓东.E-mail:mandel@xmu.cdu.cn 双语平行语料库的统计分析来构建统计翻译模型

第８卷第３期智能系统学报Ｖｏｌ．８ №．３２０１３年６月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＪｕｎ．２０１３ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１２１１０２３网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１３０５１５．０９２７．００５．ｈｔｍｌ引入复述技术的统计机器翻译研究综述胡金铭１，２，史晓东１，２，苏劲松３，陈毅东１，２（１．厦门大学信息科学与技术学院，福建厦门３６１００５；２．厦门大学福建省仿脑智能系统重点实验室，福建厦门３６１００５；３．厦门大学软件学院，福建厦门３６１００５）摘要：基于对引入复述技术的统计机器翻译研究现状的分析，提出具有研究价值的课题方向．首先归纳了复述的概念，总结了引入复述技术的统计机器翻译各类方法．然后对复述知识在统计机器翻译中的模型训练、参数调整、待译语句改写和机器翻译自动评测等方面应用的主流方法进行了概括、比较和分析，说明了复述与统计机器翻译是紧密相关的，强调了复述在统计机器翻译应用中的关键问题是复述的正确性和多样性．最后指出提高复述资源的精确度、建立复述与机器翻译的联合模型、采用新方法解决稀疏问题等是有待进一步研究的课题．关键词：复述技术；机器翻译；统计机器翻译中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１３）０３⁃０１９９⁃０９中文引用格式：胡金铭，史晓东，苏劲松，等．引入复述技术的统计机器翻译研究综述［Ｊ］．智能系统学报，２０１３，８（３）：１９９⁃２０７．英文引用格式：ＨＵＪｉｎｍｉｎｇ，ＳＨＩＸｉａｏｄｏｎｇ，ＳＵＪｉｎｓｏｎｇ，ｅｔａｌ．Ａｓｕｒｖｅｙｏｆｓｔａｔｉｓｔｉｃａｌｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎｕｓｉｎｇｐａｒａｐｈｒａｓｉｎｇｔｅｃｈ⁃ ｎｏｌｏｇｙ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１３，８（３）：１９９⁃２０７．ＡｓｕｒｖｅｙｏｆｓｔａｔｉｓｔｉｃａｌｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎｕｓｉｎｇｐａｒａｐｈｒａｓｉｎｇｔｅｃｈｎｏｌｏｇｙＨＵＪｉｎｍｉｎｇ１，２，ＳＨＩＸｉａｏｄｏｎｇ１，２，ＳＵＪｉｎｓｏｎｇ３，ＣＨＥＮＹｉｄｏｎｇ１，２（１．ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅａｎｄＥｎｇｉｎｅｅｒｉｎｇ，ＸｉａｍｅｎＵｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ３６１００５，Ｃｈｉｎａ；２．ＦｕｊｉａｎＫｅｙＬａｂｏｒａｔｏｒｙｏｆｔｈｅＢｒａｉｎ⁃ｌｉｋｅＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，ＸｉａｍｅｎＵｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ３６１００５，Ｃｈｉｎａ；３．ＣｏｌｌｅｇｅｏｆＳｏｆｔｗａｒｅ，ＸｉａｍｅｎＵｎｉｖｅｒｓｉｔｙ，Ｘｉａｍｅｎ３６１００５，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｉｎｔｈｉｓｐａｐｅｒ，ｔｈｅｒｅｓｅａｒｃｈｔｅａｍｄｉｓｃｕｓｓｅｄｐｏｓｓｉｂｌｅｎｅｗｐｒｏｓｐｅｃｔｉｖｅｒｅｓｅａｒｃｈｄｉｒｅｃｔｉｏｎｓｏｆｐａｒａｐｈｒａｓｉｎｇｔｅｃｈｎｏｌｏｇｙｉｎｓｔａｔｉｓｔｉｃａｌｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ（ＳＭＴ），ｂａｓｅｄｏｎｒｅｖｉｅｗｓｏｆｓｔａｔｅ⁃ｏｆ⁃ｔｈｅ⁃ａｒｔｔｅｃｈｎｏｌｏｇｙ．Ｆｉｒｓｔｔｈｅｒｅ⁃ ｓｅａｒｃｈｔｅａｍｉｎｔｒｏｄｕｃｅｄｔｈｅｃｏｎｃｅｐｔｏｆｐａｒａｐｈｒａｓｅｓ，ａｎｄｎｅｘｔａｓｕｍｍａｒｉｚａｔｉｏｎｏｆｔｈｅｌａｔｅｓｔｐｒｏｇｒｅｓｓｕｔｉｌｉｚｉｎｇｐａｒａ⁃ ｐｈｒａｓｉｎｇｔｅｃｈｎｏｌｏｇｙｉｎＳＭＴｗａｓｃｏｎｄｕｃｔｅｄ．Ｆｉｎａｌｌｙ，ｃｏｎｃｌｕｓｉｏｎｓｗｅｒｅｄｒａｗｎ，ｄａｔａｗａｓｃｏｍｐａｒｅｄａｎｄａｎａｎａｌｙｓｉｓｏｆｔｈｅｍａｉｎｉｓｓｕｅｓｏｆｉｎｃｏｒｐｏｒａｔｉｎｇｐａｒａｐｈｒａｓｅｓｉｎｔｏＳＭＴ，ｉｎｃｌｕｄｉｎｇｔｒａｎｓｌａｔｉｏｎｍｏｄｅｌｔｒａｉｎｉｎｇ，ｐａｒａｍｅｔｅｒｔｕｎｉｎｇ，ｉｎ⁃ ｐｕｔｓｅｎｔｅｎｃｅｓｒｅｗｒｉｔｉｎｇａｎｄｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎｅｖａｌｕａｔｉｏｎｗａｓｐｅｒｆｏｒｍｅｄ．Ｔｈｅｒｅｓｕｌｔｓｐｒｏｖｅｄｔｈａｔｔｈｅｒｅｉｓａｎｉｎｈｅｒ⁃ ｅｎｔｃｏｎｎｅｃｔｉｏｎｂｅｔｗｅｅｎｐａｒａｐｈｒａｓｉｎｇａｎｄＳＭＴ．Ｔｈｅｒｅｓｕｌｔｓａｌｓｏｐｏｉｎｔｏｕｔｔｈａｔｔｈｅｃｏｒｒｅｃｔｎｅｓｓａｎｄｄｉｖｅｒｓｉｔｙｏｆｐａｒａ⁃ ｐｈｒａｓｉｎｇａｒｅｔｈｅｋｅｙｉｓｓｕｅｓｔｏａｐｐｌｙｐａｒａｐｈｒａｓｉｎｇｔｏＳＭＴ．Ｉｔｗａｓｈｉｇｈｌｙｎｏｔｅｄｔｈａｔｔｈｅｉｍｐｒｏｖｅｍｅｎｔｉｎｔｈｅｑｕａｌｉｔｙｏｆｐａｒａｐｈｒａｓｉｎｇｒｅｓｏｕｒｃｅ，ｔｈｅｅｓｔａｂｌｉｓｈｍｅｎｔｏｆａｊｏｉｎｔｍｏｄｅｌｏｆｐａｒａｐｈｒａｓｉｎｇａｎｄｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎａｎｄｔｈｅｎｅｗｐｒｏ⁃ ｐｏｓｅｄａｐｐｒｏａｃｈｔｏｓｏｌｖｅｄａｔａｓｐａｒｓｅｎｅｓｓａｒｅｐｒｏｂｌｅｍｓｗｈｉｃｈｎｅｅｄｆｕｒｔｈｅｒｓｔｕｄｙ．Ｋｅｙｗｏｒｄｓ：ｐａｒａｐｈｒａｓｉｎｇｔｅｃｈｎｏｌｏｇｙ；ｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ；ｓｔａｔｉｓｔｉｃａｌｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ收稿日期：２０１２⁃１１⁃１６．网络出版日期：２０１３⁃０５⁃１５．基金项目：国家科技支撑计划资助项目（２０１２ＢＡＨ１４Ｆ０３）；国家自然科学基金资助项目（６０５７３１８９，６１００５０５２）；福建省自然科学基金资助项目（２００６Ｊ００４３）．通信作者：史晓东．Ｅ⁃ｍａｉｌ：ｍａｎｄｅｌ＠ｘｍｕ．ｅｄｕ．ｃｎ．机器翻译（ｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ，ＭＴ）是利用计算机程序，实现从一种自然语言到另一种自然语言的翻译．它属于计算语言学（ｃｏｍｐｕｔａｔｉｏｎａｌｌｉｎｇｕｉｓｔｉｃｓ）的范畴．经过数十年的研究，机器翻译在理论和实践方面都有了较大的进步．从方法论的角度来看，目前的主流研究使用基于统计的方法．统计机器翻译（ｓｔａｔｉｓｔｉｃａｌｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ，ＳＭＴ）是通过对大量双语平行语料库的统计分析来构建统计翻译模型

·200· 能系统学报第8卷并使用该模型进行翻译.早期的研究使用噪声信道模型风，当前的主流统计模型是对数线性模型) 1复述在统计机器翻译中的研究现状对数线性模型由若干特征组成，每个特征都反映了近年来，许多学者将复述应用到信息抽取、文本翻译概率的一个方面，该模型由于可以包含更多的生成、自动问答、自动文摘等多个相关研究领域中，反映翻译概率的信息而受到了广泛关注.从事机器如图1所示，对复述在自然语言处理的部分子课题翻译研究的学者正尝试将不同的语言学、统计学特中的文献资料做粗略统计（数据来自Google学术搜征加人到对数线性模型中，使翻译系统更加强大.而索)，可见，其中讨论得最为广泛的是复述在机器翻反映语言多样性的复述技术(paraphrasing technolo- 译研究中的应用. gies)也被用来改善机器翻译的效果. 随着自然语言处理各项底层技术的不断成熟和其他发展，复述(paraphrases)作为自然语言处理中一种自动文摘， 9% 机器翻译非常普遍的现象，受到了越来越多研究者的关注.刘 9% 31% 挺4)、赵世奇[)等国内学者也都对复述技术研究进行了详细综述很多学者试图给复述一个精确的定 27% 义，早在20世纪80年代，语言学家Halliday和De 自动问答 18% Beaugrande等认为复述是“概念上的近似等价”，但 6% 信息抽取互为复述的2个语言片段的可替换程度(inter- changeability)始终没有确切的标准[6-].Barzilay 文本生成等[]把复述看作传达相同信息的可替换形式图1复述在自然语言处理子课题的应用统计 Glickman等[o]则认为复述现象反映了语言多变性 Fig.1 Statistics of using paraphrases in sub-subject of NLP 的核心，复述是对应到相同意义的等价表达.鉴于上复述是单语同义文本的表达形式转换，而机器述观点，笔者认为复述就是在同一种语言内有相同翻译则是跨语言同义文本的表达形式转换.它们的语义但有不同表达形式的语言片段，它反映了人类共通性也使得机器翻译中的理论和方法可以用于解语言的灵活多样性，同时也为自然语言处理的研究决复述问题，因此有基于MT的复述生成方法[)」难点提供了更多的解决方法同样，复述技术也可以解决机器翻译问题统计机器翻译的实质是对大规模的双语语料进在21世纪初，机器翻译中基于统计方法逐渐趋行统计，提取有助于文本翻译的规则这些规则使得于主导地位.在研究过程中，越来越多的学者发现语翻译系统可以较好地处理字面上的直译，但其并没料资源不足会极大影响统计翻译系统的翻译质量，有真正意义上的意译能力，即无法翻译未知文本.随复述便成为了一个解决办法.复述可以从更为广泛着时间的推进，科技发展、知识增长，语言也在不断的语料中获取，如同义词词典、单语可比语料、单语地进化，不可能存在包含所有语言现象的语料库.然平行语料等，更多的单语知识可以改善翻译系统性而，复述技术可以将未知文本片段转化成语料库中能.从方法角度上讲，将复述引入到统计机器翻译的出现的同义表述：那么，适时地引入复述技术便可以研究集中在改进其4个阶段，引入到前3个阶段是提高翻译系统的性能。为了提升翻译效果，而对于自动评测主要是为了提目前由于统计机器翻译的研究热点是对数线性升机器评价和人工评价的一致性.为了更直观地对模型，因此将复述技术引入统计机器翻译的研究也比前3种途径翻译效果的提升程度，图2列出了各多数围绕对数线型模型展开.基于对数线性模型的方法在BLEU值上的提升比.因为各学者选取的实统计机器翻译大致可以分为4个阶段：翻译模型的验数据并不一致，结果对比可能略有出入.但从图2 训练、特征参数的调整、译文的搜索解码、翻译质量中可以发现，对待译语句的改写可以更好地提升翻的自动评价.本文介绍了复述与统计机器翻译的概译质量（图中的参数调整部分，因为数据都来自念，并对复述技术与统计机器翻译中各个阶段内容 Madnani的研究，故命名为“年份.人工参考译文数的联系进行概述，最后对引入复述技术的统计机器量”，“H”前的数字表示开发集的人工参考译文数翻译研究进展及前沿课题进行分析评述，概括并凝量).下面从4个方面分别介绍引入复述的统计机器练出具有研究价值的课题方向，希望对统计机器翻翻译研究的国内外发展现状」译领域的研究有所神益

并使用该模型进行翻译．早期的研究使用噪声信道模型［１⁃２］，当前的主流统计模型是对数线性模型［３］．对数线性模型由若干特征组成，每个特征都反映了翻译概率的一个方面，该模型由于可以包含更多的反映翻译概率的信息而受到了广泛关注．从事机器翻译研究的学者正尝试将不同的语言学、统计学特征加入到对数线性模型中，使翻译系统更加强大．而反映语言多样性的复述技术（ｐａｒａｐｈｒａｓｉｎｇｔｅｃｈｎｏｌｏ⁃ ｇｉｅｓ）也被用来改善机器翻译的效果．随着自然语言处理各项底层技术的不断成熟和发展，复述（ｐａｒａｐｈｒａｓｅｓ）作为自然语言处理中一种非常普遍的现象，受到了越来越多研究者的关注．刘挺［４］、赵世奇［５］等国内学者也都对复述技术研究进行了详细综述．很多学者试图给复述一个精确的定义，早在２０世纪８０年代，语言学家Ｈａｌｌｉｄａｙ和ＤｅＢｅａｕｇｒａｎｄｅ等认为复述是“概念上的近似等价”，但互为复述的２个语言片段的可替换程度（ｉｎｔｅｒ⁃ ｃｈａｎｇｅａｂｉｌｉｔｙ）始终没有确切的标准［６⁃７］．Ｂａｒｚｉｌａｙ等［８⁃９］把复述看作传达相同信息的可替换形式．Ｇｌｉｃｋｍａｎ等［１０］则认为复述现象反映了语言多变性的核心，复述是对应到相同意义的等价表达．鉴于上述观点，笔者认为复述就是在同一种语言内有相同语义但有不同表达形式的语言片段，它反映了人类语言的灵活多样性，同时也为自然语言处理的研究难点提供了更多的解决方法．统计机器翻译的实质是对大规模的双语语料进行统计，提取有助于文本翻译的规则．这些规则使得翻译系统可以较好地处理字面上的直译，但其并没有真正意义上的意译能力，即无法翻译未知文本．随着时间的推进，科技发展、知识增长，语言也在不断地进化，不可能存在包含所有语言现象的语料库．然而，复述技术可以将未知文本片段转化成语料库中出现的同义表述；那么，适时地引入复述技术便可以提高翻译系统的性能．目前由于统计机器翻译的研究热点是对数线性模型，因此将复述技术引入统计机器翻译的研究也多数围绕对数线型模型展开．基于对数线性模型的统计机器翻译大致可以分为４个阶段：翻译模型的训练、特征参数的调整、译文的搜索解码、翻译质量的自动评价．本文介绍了复述与统计机器翻译的概念，并对复述技术与统计机器翻译中各个阶段内容的联系进行概述，最后对引入复述技术的统计机器翻译研究进展及前沿课题进行分析评述，概括并凝练出具有研究价值的课题方向，希望对统计机器翻译领域的研究有所裨益．１复述在统计机器翻译中的研究现状近年来，许多学者将复述应用到信息抽取、文本生成、自动问答、自动文摘等多个相关研究领域中．如图１所示，对复述在自然语言处理的部分子课题中的文献资料做粗略统计（数据来自Ｇｏｏｇｌｅ学术搜索），可见，其中讨论得最为广泛的是复述在机器翻译研究中的应用．图１复述在自然语言处理子课题的应用统计Ｆｉｇ．１Ｓｔａｔｉｓｔｉｃｓｏｆｕｓｉｎｇｐａｒａｐｈｒａｓｅｓｉｎｓｕｂ⁃ｓｕｂｊｅｃｔｏｆＮＬＰ复述是单语同义文本的表达形式转换，而机器翻译则是跨语言同义文本的表达形式转换．它们的共通性也使得机器翻译中的理论和方法可以用于解决复述问题，因此有基于ＭＴ的复述生成方法［１１⁃１３］．同样，复述技术也可以解决机器翻译问题．在２１世纪初，机器翻译中基于统计方法逐渐趋于主导地位．在研究过程中，越来越多的学者发现语料资源不足会极大影响统计翻译系统的翻译质量，复述便成为了一个解决办法．复述可以从更为广泛的语料中获取，如同义词词典、单语可比语料、单语平行语料等，更多的单语知识可以改善翻译系统性能．从方法角度上讲，将复述引入到统计机器翻译的研究集中在改进其４个阶段，引入到前３个阶段是为了提升翻译效果，而对于自动评测主要是为了提升机器评价和人工评价的一致性．为了更直观地对比前３种途径翻译效果的提升程度，图２列出了各方法在ＢＬＥＵ值上的提升比．因为各学者选取的实验数据并不一致，结果对比可能略有出入．但从图２中可以发现，对待译语句的改写可以更好地提升翻译质量（图中的参数调整部分，因为数据都来自Ｍａｄｎａｎｉ的研究，故命名为“年份．人工参考译文数量”，“Ｈ” 前的数字表示开发集的人工参考译文数量）．下面从４个方面分别介绍引入复述的统计机器翻译研究的国内外发展现状． ·２００· 智能系统学报第８卷

第3期胡金铭，等：引入复述技术的统计机器翻译研究综述 ·201· (2)所示：三 Pre(elf月=P(eIC(e))×P(C(e)ICf))= 6 三 #(e)x#(c(e),cD) (2) 尊三 #C(e)#C(f) 式中：C(e)、C()分别代表目标端和源端的短语类研究者认为复述片段含义相同，不应分别进行概率 0 估计，应对同类短语一并计算.可以验证，当P为0 模型训练参数调整语句改写时，Ppc不为O.所以当e出现的频次很小时，Pc会有图2各方法效果对比更好的概率估计.他提出了利用基于短语共现次数 Fig.2 Comparison with BLEU on various methods 和基于词序的2种相似度计算来进行短语聚类的方法，获得了很好的效果 1.1复述改善模型训练 Max针对短语概率估计提出了2个观点：1)一训练数据不足会引起数据稀疏，引入复述知识，个合适的短语需要更多地参与到概率估计：2)复述对已有的训练数据或者规则表进行处理可以改善这可以用来优化概率估计).他利用源端∫的上下文一问题.通常有2种途径：1)对训练数据的平行句对相似度的计算代替传统的频次统计，上下文相似度生成复述从而扩充训练数据的规模：2)利用短语间偏低的短语，其概率的估计也会较低，则相应译文可的复述关系平滑翻译模型的概率估计使其更加取度降低.如式(3)所示：准确. 以 sim(Cont(f),Cont(f)) 统计机器翻译的模型训练是通过大规模的双语 Pom(e;I f)= 平行语料获得.由于语言的多样性，训练集不能覆盖 sim(Cont(f),Cont(f)) 所有的语言现象，对稀有语种而言尤为明显.当无法 (3) 直接获得更多训练语料时，研究者利用复述技术扩充训练集的规模，提高模型的覆盖率.基本思想是对 w以 sim(Cont(f),Cont(p)) 双语平行句对(f,)的源端f生成句法等价的句级 P(e:I A= sim(Cont(f月，Cont(pk)) 复述fPP与目标端e重新组合构成新句对(fP,e) (4) 加入到训练集中.Bond针对词序、时态等语言学现象并结合句法信息生成复述I4).Nakov则对名词短式中：f是测试集中待译的源短语，f是∫在训练集语进行复述，首先识别句中的名词短语，利用人中出现的第k个特例，e,表示f的所有可能译文，e 是f的特定译文，Cont(f)是指f的上下文.P通过为定义的包含句法信息的复述规则，仅当句子中发比较测试语句中短语f的上下文与译文为e:的特例现符合复述转换规则结构的名词短语时才生成复 f的上下文的相似度，来估计e:是f译文的概率.式述.Nakov不但扩充训练集，还对已训练的规则表进 (4)利用复述对式(3)进行补充，作为另一个特征加行类似实验，结果表明对短语表进行复述并没有对训练数据进行复述的效果好.这是因为规则表是经入到模型中p:是f的复述，〈P:,e:〉是训练集中的短语对.同样，考虑上下文信息来估计e:是f译文的概过分词、对齐等前序步骤后得到，其中已含有噪声；率.式(3)解决了Max提出的第1个问题，使上下文同时对规则表复述没有考虑句法信息及上下文信信息更接近短语主导概率的估计，式(4)则缓解了息，新生成的翻译规则可能并不合理。上下文种类较少带来的数据稀疏问题，短语概率作为SMT的一个非常重要的特征，传 1.2复述提高调参效果统方法使用最大似然估计，通过词频的累加来计算，目前统计机器翻译的参数调整大多采用最小错如式(1)所示，式中#表示频次统计.这种方法的不足误率训练方法[18].通常使用基于n元组匹配的之处是，当短语出现次数较少时，其概率估计会出现 BLEU]等评测指标作为最小错误率.因此在调参较大误差.Kuhn和Max引入复述技术来进行平滑翻过程中所使用的开发集规模越大、多样性越强、参考译模型概率估计的研究。译文数量越多，n元组匹配的准确性就越高，调参的 #(f,e:) PRF(e:IA)=- (1) 效果也就越好.基于这个思想，Madnani引入复述知 ∑#(f,e) 识，对开发集的参考译文进行扩展，来增加参考译文 Kuhn利用短语聚类来进行平滑处理o],如式的多样性2).首先，利用层次短语系统训练出双语

图２各方法效果对比Ｆｉｇ．２ＣｏｍｐａｒｉｓｏｎｗｉｔｈＢＬＥＵｏｎｖａｒｉｏｕｓｍｅｔｈｏｄｓ１．１复述改善模型训练训练数据不足会引起数据稀疏，引入复述知识，对已有的训练数据或者规则表进行处理可以改善这一问题．通常有２种途径：１）对训练数据的平行句对生成复述从而扩充训练数据的规模；２）利用短语间的复述关系平滑翻译模型的概率估计使其更加准确．统计机器翻译的模型训练是通过大规模的双语平行语料获得．由于语言的多样性，训练集不能覆盖所有的语言现象，对稀有语种而言尤为明显．当无法直接获得更多训练语料时，研究者利用复述技术扩充训练集的规模，提高模型的覆盖率．基本思想是对双语平行句对（ｆ，ｅ）的源端ｆ生成句法等价的句级复述ｆ’，ｆ’与目标端ｅ重新组合构成新句对（ｆ’，ｅ）加入到训练集中．Ｂｏｎｄ针对词序、时态等语言学现象并结合句法信息生成复述［１４］．Ｎａｋｏｖ则对名词短语进行复述［１５］，首先识别句中的名词短语，利用人为定义的包含句法信息的复述规则，仅当句子中发现符合复述转换规则结构的名词短语时才生成复述．Ｎａｋｏｖ不但扩充训练集，还对已训练的规则表进行类似实验，结果表明对短语表进行复述并没有对训练数据进行复述的效果好．这是因为规则表是经过分词、对齐等前序步骤后得到，其中已含有噪声；同时对规则表复述没有考虑句法信息及上下文信息，新生成的翻译规则可能并不合理．短语概率作为ＳＭＴ的一个非常重要的特征，传统方法使用最大似然估计，通过词频的累加来计算，如式（１）所示，式中＃表示频次统计．这种方法的不足之处是，当短语出现次数较少时，其概率估计会出现较大误差．Ｋｕｈｎ和Ｍａｘ引入复述技术来进行平滑翻译模型概率估计的研究．ＰＲＦ（ｅｉ｜ｆ）＝＃（ｆ，ｅｉ） ∑ｊ＃（ｆ，ｅｊ）．（１）Ｋｕｈｎ利用短语聚类来进行平滑处理［１６］，如式（２）所示：ＰＰＣ（ｅ｜ｆ）＝Ｐ（ｅ｜Ｃ（ｅ）） × Ｐ（Ｃ（ｅ）｜Ｃ（ｆ））＝＃（ｅ）＃Ｃ（ｅ） × ＃（Ｃ（ｅ），Ｃ（ｆ））＃Ｃ（ｆ）．（２）式中：Ｃ（ｅ）、Ｃ（ｆ）分别代表目标端和源端的短语类．研究者认为复述片段含义相同，不应分别进行概率估计，应对同类短语一并计算．可以验证，当ＰＲＦ为０时，ＰＰＣ不为０．所以当ｅ出现的频次很小时，ＰＰＣ会有更好的概率估计．他提出了利用基于短语共现次数和基于词序的２种相似度计算来进行短语聚类的方法，获得了很好的效果．Ｍａｘ针对短语概率估计提出了２个观点：１）一个合适的短语需要更多地参与到概率估计；２）复述可以用来优化概率估计［１７］．他利用源端ｆ的上下文相似度的计算代替传统的频次统计，上下文相似度偏低的短语，其概率的估计也会较低，则相应译文可取度降低．如式（３）所示：Ｐｃｏｎｔ（ｅｉ｜ｆ）＝ ∑〈ｆｋ，ｅｉ〉ｓｉｍ（Ｃｏｎｔ（ｆ），Ｃｏｎｔ（ｆｋ）） ∑〈ｆｋ，ｅｊ〉ｓｉｍ（Ｃｏｎｔ（ｆ），Ｃｏｎｔ（ｆｋ））．（３）Ｐｐａｒａ（ｅｉ｜ｆ）＝ ∑〈ｐｋ，ｅｉ〉ｓｉｍ（Ｃｏｎｔ（ｆ），Ｃｏｎｔ（ｐｋ）） ∑〈ｐｋ，ｅｊ〉ｓｉｍ（Ｃｏｎｔ（ｆ），Ｃｏｎｔ（ｐｋ））．（４）式中：ｆ是测试集中待译的源短语，ｆｋ是ｆ在训练集中出现的第ｋ个特例，ｅｊ表示ｆｋ的所有可能译文，ｅｉ是ｆｋ的特定译文，Ｃｏｎｔ（ｆ）是指ｆ的上下文．Ｐｃｏｎｔ通过比较测试语句中短语ｆ的上下文与译文为ｅｉ的特例ｆｋ的上下文的相似度，来估计ｅｉ是ｆ译文的概率．式（４）利用复述对式（３）进行补充，作为另一个特征加入到模型中．ｐｋ是ｆ的复述，〈ｐｋ，ｅｉ〉是训练集中的短语对．同样，考虑上下文信息来估计ｅｉ是ｆ译文的概率．式（３）解决了Ｍａｘ提出的第１个问题，使上下文信息更接近短语主导概率的估计，式（４）则缓解了上下文种类较少带来的数据稀疏问题．１．２复述提高调参效果目前统计机器翻译的参数调整大多采用最小错误率训练方法［１８］．通常使用基于ｎ元组匹配的ＢＬＥＵ［１９］等评测指标作为最小错误率．因此在调参过程中所使用的开发集规模越大、多样性越强、参考译文数量越多，ｎ元组匹配的准确性就越高，调参的效果也就越好．基于这个思想，Ｍａｄｎａｎｉ引入复述知识，对开发集的参考译文进行扩展，来增加参考译文的多样性［２０］．首先，利用层次短语系统训练出双语第３期胡金铭，等：引入复述技术的统计机器翻译研究综述 ·２０１·

·202· 智能系统学报第8卷层次规则[2]，如式(5)~(7)所示：其次，利用基于枢 1.3复述改写待译语句轴法(pivot-.based)的复述获取，抽取单语层次规则，利用复述生成技术，对机器翻译系统的输入语如式(8)~(9)所示。句进行改写24].尤其是对于口语翻译而言，将形式 X→<X,建X2;X,to build X2>, (5) 灵活且不规范的口语语句改写为规范的书面语语 X→<X,建X2:X1 to construct X2>,(6) 句，无疑会降低翻译系统的处理难度[262.对于资源 X→<X,建X2;X,to formulate X2>,(7) 不足的语言对，翻译系统无法翻译出包含未知词汇 <X to build X2;X to construct X2 >(8) 的待译语句，却能够翻译意义相近而没有未登录词 <X to build X2;X to formulate X2 >.(9) 的复述句.因此可以引入复述知识，改写待译语句，使系统能够翻译原本无法翻译的句子获得单语层次规则后建立单语的翻译模型，通 Callison-Burch提出使用枢轴法获取复述来替过该模型的解码对已有的人工参考译文进行复述扩换待译语句中未知的词和短语，并使用该复述的译展，并加入到开发集中进行调参.2007年Madnani又文作为翻译结果[2】.Marton也开展了类似的研做了进一步补充2四，生成参考译文的n-best复述译究[]，不同的是Marton从单语语料获取复述，他们文，并利用启发式规则进行过滤.但经实验发现，n 的研究局限于只替换待译语句的未知片段这种不取到3以上便会由于复述带来的噪声使得调参效果考虑句法信息的替换极有可能导致复述语句语法不变差.针对这些不足，Madnani在2011年提出细化复通、语序不畅、语义混乱.Mirkin则利用WordNet得述生成过程]，在不改变参考译文原意的前提下使到文本蕴含和复述规则，利用上下文模型对复述打生成的参考译文复述和机器译文有尽可能多的字面分，翻译前k条规则生成的复述，并用语言模型为译匹配，并将其加入到在线调参过程中，使翻译质量有文进行打分，最后选择分数较高的译文[].其优点所提高.虽然Madnani在不断细化复述的生成，但其是不仅利用了人工知识WordNet,还利用上下文判方法仍有几，点不足之处：1)用单语翻译解码来生成断复述句是否合理，避免盲目改写，但缺点是系统解复述句，缺少对一些错误复述的过滤：2)由于单语码过程更加复杂。开发集的稀缺，单语翻译模型调参的准确性有待考 Onishi和Du利用短语级复述构建待译语句的证：3)词语对齐、复述生成、单语翻译等前序步骤带复述词图(word lattice)[3-3].图3是“the exercise 来的噪声传播也会对翻译产生负面影响：4)n-best will continue'”的词图结构，图中双圆圈和实线箭头多样性随的数目增加逐渐变小，而引入的噪声却分别代表待译语句最初的节点和单词，单圆圈和虚起了主要作用线箭头分别代表复述扩充的节点和单词 practiced(0.07) resume(0.10) training(0.12) continuation(0.09) --- 3 exercise(1.00) continue(1.00) continuons(0.12) 4 the(1.00) practice(0.11) practicing(0.10) wi0.122 keeping(0.08) resume(1.00) 6 exercising(0.08) wi0.11) training(0.12) go1.00) hc0.10) -exercises(0.11) training(1.00) 图3输入语句的复述词图构建示例) Fig.3 An example of how to build a paraphrase lattice for an input sentencet]

层次规则［２１］，如式（５）～（７）所示；其次，利用基于枢轴法（ｐｉｖｏｔ⁃ｂａｓｅｄ）的复述获取，抽取单语层次规则，如式（８）～（９）所示．Ｘ → ＜Ｘ１建Ｘ２；Ｘ１ｔｏｂｕｉｌｄＸ２＞，（５）Ｘ → ＜Ｘ１建Ｘ２；Ｘ１ｔｏｃｏｎｓｔｒｕｃｔＸ２＞，（６）Ｘ → ＜Ｘ１建Ｘ２；Ｘ１ｔｏｆｏｒｍｕｌａｔｅＸ２＞，（７）Ｘ → ＜Ｘ１ｔｏｂｕｉｌｄＸ２；Ｘ１ｔｏｃｏｎｓｔｒｕｃｔＸ２＞，（８）Ｘ → ＜Ｘ１ｔｏｂｕｉｌｄＸ２；Ｘ１ｔｏｆｏｒｍｕｌａｔｅＸ２＞．（９）获得单语层次规则后建立单语的翻译模型，通过该模型的解码对已有的人工参考译文进行复述扩展，并加入到开发集中进行调参．２００７年Ｍａｄｎａｎｉ又做了进一步补充［２２］，生成参考译文的ｎ⁃ｂｅｓｔ复述译文，并利用启发式规则进行过滤．但经实验发现，ｎ取到３以上便会由于复述带来的噪声使得调参效果变差．针对这些不足，Ｍａｄｎａｎｉ在２０１１年提出细化复述生成过程［２３］，在不改变参考译文原意的前提下使生成的参考译文复述和机器译文有尽可能多的字面匹配，并将其加入到在线调参过程中，使翻译质量有所提高．虽然Ｍａｄｎａｎｉ在不断细化复述的生成，但其方法仍有几点不足之处：１）用单语翻译解码来生成复述句，缺少对一些错误复述的过滤；２）由于单语开发集的稀缺，单语翻译模型调参的准确性有待考证；３）词语对齐、复述生成、单语翻译等前序步骤带来的噪声传播也会对翻译产生负面影响；４）ｎ⁃ｂｅｓｔ多样性随ｎ的数目增加逐渐变小，而引入的噪声却起了主要作用．１．３复述改写待译语句利用复述生成技术，对机器翻译系统的输入语句进行改写［２４⁃２５］．尤其是对于口语翻译而言，将形式灵活且不规范的口语语句改写为规范的书面语语句，无疑会降低翻译系统的处理难度［２６⁃２７］．对于资源不足的语言对，翻译系统无法翻译出包含未知词汇的待译语句，却能够翻译意义相近而没有未登录词的复述句．因此可以引入复述知识，改写待译语句，使系统能够翻译原本无法翻译的句子．Ｃａｌｌｉｓｏｎ⁃Ｂｕｒｃｈ提出使用枢轴法获取复述来替换待译语句中未知的词和短语，并使用该复述的译文作为翻译结果［２８］．Ｍａｒｔｏｎ也开展了类似的研究［２９］，不同的是Ｍａｒｔｏｎ从单语语料获取复述，他们的研究局限于只替换待译语句的未知片段．这种不考虑句法信息的替换极有可能导致复述语句语法不通、语序不畅、语义混乱．Ｍｉｒｋｉｎ则利用ＷｏｒｄＮｅｔ得到文本蕴含和复述规则，利用上下文模型对复述打分，翻译前ｋ条规则生成的复述，并用语言模型为译文进行打分，最后选择分数较高的译文［３０］．其优点是不仅利用了人工知识ＷｏｒｄＮｅｔ，还利用上下文判断复述句是否合理，避免盲目改写，但缺点是系统解码过程更加复杂．Ｏｎｉｓｈｉ和Ｄｕ利用短语级复述构建待译语句的复述词图（ｗｏｒｄｌａｔｔｉｃｅ）［３１⁃３３］．图３是 “ ｔｈｅｅｘｅｒｃｉｓｅｗｉｌｌｃｏｎｔｉｎｕｅ” 的词图结构，图中双圆圈和实线箭头分别代表待译语句最初的节点和单词，单圆圈和虚线箭头分别代表复述扩充的节点和单词．图３输入语句的复述词图构建示例［３２］Ｆｉｇ．３Ａｎｅｘａｍｐｌｅｏｆｈｏｗｔｏｂｕｉｌｄａｐａｒａｐｈｒａｓｅｌａｔｔｉｃｅｆｏｒａｎｉｎｐｕｔｓｅｎｔｅｎｃｅ［３２］ ·２０２· 智能系统学报第８卷

第3期胡金铭，等：引人复述技术的统计机器翻译研究综述 ·203· 构建词图的好处是不用区分待译语句中的未知的复述规则中没有实词的替换规则，所以该方法减词和已知词，而是让翻译系统的解码器根据词图自少了内容词替换带来的任意性：但只能处理功能词行搜索最优翻译结果，提高容错性.这样可以构造比和日文语气词，有一定局限性.Lepage利用类似复述 Callison-Burch方法更为流利的复述输入语句，其缺模板的方法生成参考译文的复述集，丰富参考译文陷在于构造词图时过多的边数会导致复杂度成倍提的表达[].Zhou则针对BLEU没有考虑召回率和缺升.此外，部分不当替换不但会增大词图的搜索空间少对复述匹配的支持来进行改善，提出了基于而且也不能改善翻译效果，需进行适当的剪枝.He BLEU的ParaEval评测方法[3，对1-gram的匹配进的研究[3]与Du相似，他采用一种正向翻译与反向行修改使其支持了复述匹配，并使用单参考译文计翻译相结合的方法获取复述.正向翻译就是源端到算召回率. 目标端的翻译过程，反向翻译则是目标端到源端的 Russo-Lassner对(x,h)训练线性回归模型，其翻译过程.他利用一次正向翻译的译文T和经过反中x是一个代表机器译文和参考译文句对间一致性向翻译后再正向翻译的译文T,作为抽取复述的单的特征向量，h是对机器译文的人工评分[o.他将机语平行语料，然后通过启发式规则的过滤，利用层次器翻译自动评测任务看作复述识别，即对比机器译短语系统的规则抽取方法[2]构建复述规则，之后再文与参考译文之间的词汇、句法信息的变化，因此特构造词图这样做的好处有2点：1)不但生成了词和征选择包括词千共现、WordNet同义词集、动词语义短语级的复述，而且可以生成句级的复述：2)因为类等复述规则由翻译系统得来，对于部分病态复述，经翻 Snover基于其在2006年提出的TER评测指译系统的病态处理，会意外获得质量更好的结果，这标，融合了可调参数、形态学分析、同义词以及复述也体现了复述和统计机器翻译融合的思想之后，提出新的评测指标TERp[412].TERp不但将参 Resnik通过迭代修改待译语句来解决翻译质量考译文和机器译文字面相同的片段匹配，还将有相较差的问题[]其方法是，对翻译系统的翻译结果同词干或同义词的片段匹配.TER即保留了TER的进行评判，将译文中翻译较差的片段所对应的源语编辑操作一匹配、插人、删除、替换、移动，还增加句片段进行复述，构造出新的输入语句，新输入语句了词干匹配、同义词匹配、短语替换，使评价结果与的译文要优于原译文.该方法较Callison-Burch的方人工评价的一致性更高：法[2)能更针对地构造复述，利用TER即中定义的多 Pado将文本蕴含(textual entailment)用在机器种操作来判断哪些片段应该构造复述，翻译的评测中[4).蕴含被定义为一个前提P(prem- 1.4复述改善机器翻译自动评测 ise)和一个假设H(hypothesis)之间的二元关系，即机器翻译的自动评测一直是机器翻译研究中的若已知前提P成立可以推出H为真，则说P蕴含H 难点，目前最为广泛使用的指标是BLEU9,它计算研究者一般将复述看作蕴含的特例，因为复述是双机器译文和参考译文间n-gram的匹配准确率，将其向的，而蕴含的推理是单向的.举例说明：设P为加权得到评价分数.很多学者基于BLEU指标改善 “Jane is a French teacher”,H为“Jane can speak 机器翻译的自动测评.Kauchak调查发现，NIST2004 French”,则P蕴含H,H可从P中推理出来，相反P 测试集中每个句子的参考译文两两组成句对，其中不一定能从H推理出来.Pado认为好的机器译文与 0.2%是字面完全一致的，60%至少11个词不同] 参考译文是双向蕴含的，机器译文内容的缺失会破这就意味着，如果参考译文的数量有限时(1~3 坏正向蕴含，而机器译文内容的增添又会打破反向句)，那么基于字面匹配的自动评测永远不可能达蕴含，如果双向蕴含都不成立则认为翻译结果较差到人工评测的水平.因此，Kauchak提出应该使参考蕴含识别可以包含更多的语义和语法知识，利用蕴译文更多地包含机器译文的词或短语，而这也是早含信息的“深度”匹配自然会优于简单的字面匹配期学者们改善评测技术的主要手段.他利用WordNet 评测标准从参考译文和机器译文中识别可能构造复述的词 2复述在统计机器翻译中的应用分析对，测试候选复述是否在参考译文的上下文中可采纳，然后生成参考译文的复述，达到增加参考译文数复述作为人类语言中的一个普遍现象，受到自量的目的.Kanayama考虑日语相比英语更多样性和然语言处理界学者的广泛关注.尤其在机器翻译领胶合性[列]，利用人工定义的复述规则加以形态学分域，在不同的阶段引入复述技术，在一定程度上改善析，生成参考译文的复述，构造更多的参考译文，来了翻译质量.鉴于前人的研究工作，将复述引入机器提高自动评价和人工评价的一致性.因为人工定义翻译的不同阶段中，确实可以改善翻译结果但在机

构建词图的好处是不用区分待译语句中的未知词和已知词，而是让翻译系统的解码器根据词图自行搜索最优翻译结果，提高容错性．这样可以构造比Ｃａｌｌｉｓｏｎ⁃Ｂｕｒｃｈ方法更为流利的复述输入语句，其缺陷在于构造词图时过多的边数会导致复杂度成倍提升．此外，部分不当替换不但会增大词图的搜索空间而且也不能改善翻译效果，需进行适当的剪枝．Ｈｅ的研究［３４］与Ｄｕ相似，他采用一种正向翻译与反向翻译相结合的方法获取复述．正向翻译就是源端到目标端的翻译过程，反向翻译则是目标端到源端的翻译过程．他利用一次正向翻译的译文Ｔ１和经过反向翻译后再正向翻译的译文Ｔ２作为抽取复述的单语平行语料，然后通过启发式规则的过滤，利用层次短语系统的规则抽取方法［２１］构建复述规则，之后再构造词图．这样做的好处有２点：１）不但生成了词和短语级的复述，而且可以生成句级的复述；２）因为复述规则由翻译系统得来，对于部分病态复述，经翻译系统的病态处理，会意外获得质量更好的结果，这也体现了复述和统计机器翻译融合的思想．Ｒｅｓｎｉｋ通过迭代修改待译语句来解决翻译质量较差的问题［３５］．其方法是，对翻译系统的翻译结果进行评判，将译文中翻译较差的片段所对应的源语句片段进行复述，构造出新的输入语句，新输入语句的译文要优于原译文．该方法较Ｃａｌｌｉｓｏｎ⁃Ｂｕｒｃｈ的方法［２８］能更针对地构造复述，利用ＴＥＲｐ中定义的多种操作来判断哪些片段应该构造复述．１．４复述改善机器翻译自动评测机器翻译的自动评测一直是机器翻译研究中的难点，目前最为广泛使用的指标是ＢＬＥＵ［１９］，它计算机器译文和参考译文间ｎ⁃ｇｒａｍ的匹配准确率，将其加权得到评价分数．很多学者基于ＢＬＥＵ指标改善机器翻译的自动测评．Ｋａｕｃｈａｋ调查发现，ＮＩＳＴ２００４测试集中每个句子的参考译文两两组成句对，其中０．２％是字面完全一致的，６０％至少１１个词不同［３６］．这就意味着，如果参考译文的数量有限时（１～３句），那么基于字面匹配的自动评测永远不可能达到人工评测的水平．因此，Ｋａｕｃｈａｋ提出应该使参考译文更多地包含机器译文的词或短语，而这也是早期学者们改善评测技术的主要手段．他利用ＷｏｒｄＮｅｔ从参考译文和机器译文中识别可能构造复述的词对，测试候选复述是否在参考译文的上下文中可采纳，然后生成参考译文的复述，达到增加参考译文数量的目的．Ｋａｎａｙａｍａ考虑日语相比英语更多样性和胶合性［３７］，利用人工定义的复述规则加以形态学分析，生成参考译文的复述，构造更多的参考译文，来提高自动评价和人工评价的一致性．因为人工定义的复述规则中没有实词的替换规则，所以该方法减少了内容词替换带来的任意性；但只能处理功能词和日文语气词，有一定局限性．Ｌｅｐａｇｅ利用类似复述模板的方法生成参考译文的复述集，丰富参考译文的表达［３８］．Ｚｈｏｕ则针对ＢＬＥＵ没有考虑召回率和缺少对复述匹配的支持来进行改善，提出了基于ＢＬＥＵ的ＰａｒａＥｖａｌ评测方法［３９］，对１⁃ｇｒａｍ的匹配进行修改使其支持了复述匹配，并使用单参考译文计算召回率．Ｒｕｓｓｏ⁃Ｌａｓｓｎｅｒ对（ｘ，ｈ）训练线性回归模型，其中ｘ是一个代表机器译文和参考译文句对间一致性的特征向量，ｈ是对机器译文的人工评分［４０］．他将机器翻译自动评测任务看作复述识别，即对比机器译文与参考译文之间的词汇、句法信息的变化，因此特征选择包括词干共现、ＷｏｒｄＮｅｔ同义词集、动词语义类等．Ｓｎｏｖｅｒ基于其在２００６年提出的ＴＥＲ评测指标，融合了可调参数、形态学分析、同义词以及复述之后，提出新的评测指标ＴＥＲｐ［４１⁃４２］．ＴＥＲｐ不但将参考译文和机器译文字面相同的片段匹配，还将有相同词干或同义词的片段匹配．ＴＥＲｐ保留了ＴＥＲ的编辑操作———匹配、插入、删除、替换、移动，还增加了词干匹配、同义词匹配、短语替换，使评价结果与人工评价的一致性更高．Ｐａｄｏ将文本蕴含（ｔｅｘｔｕａｌｅｎｔａｉｌｍｅｎｔ）用在机器翻译的评测中［４３］．蕴含被定义为一个前提Ｐ（ｐｒｅｍ⁃ ｉｓｅ）和一个假设Ｈ（ｈｙｐｏｔｈｅｓｉｓ）之间的二元关系，即若已知前提Ｐ成立可以推出Ｈ为真，则说Ｐ蕴含Ｈ．研究者一般将复述看作蕴含的特例，因为复述是双向的，而蕴含的推理是单向的．举例说明：设Ｐ为 “ ＪａｎｅｉｓａＦｒｅｎｃｈｔｅａｃｈｅｒ”，Ｈ为 “ ＪａｎｅｃａｎｓｐｅａｋＦｒｅｎｃｈ”，则Ｐ蕴含Ｈ，Ｈ可从Ｐ中推理出来，相反Ｐ不一定能从Ｈ推理出来．Ｐａｄｏ认为好的机器译文与参考译文是双向蕴含的，机器译文内容的缺失会破坏正向蕴含，而机器译文内容的增添又会打破反向蕴含，如果双向蕴含都不成立则认为翻译结果较差．蕴含识别可以包含更多的语义和语法知识，利用蕴含信息的“深度”匹配自然会优于简单的字面匹配评测标准．２复述在统计机器翻译中的应用分析复述作为人类语言中的一个普遍现象，受到自然语言处理界学者的广泛关注．尤其在机器翻译领域，在不同的阶段引入复述技术，在一定程度上改善了翻译质量．鉴于前人的研究工作，将复述引入机器翻译的不同阶段中，确实可以改善翻译结果．但在机第３期胡金铭，等：引入复述技术的统计机器翻译研究综述 ·２０３·

点击进入文档下载页（PDF格式）

共9页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录