当前位置：和泉文库 > 计算机 > 浏览文档

西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第4章机器翻译部分（机器翻译方法）

4 . 1 机器翻译的四种实现方法 4.2 基于实例的机器翻译改进方法 4.3 基于实例的机器翻译方法实践

文件格式：PPT，文件大小：423KB，售价：15.5元

文档详细内容（约56页）

6A第4章机器翻译方法然而,中间语言的机器翻译方法也常遭到怀疑。因为是否能够构造出表示各种不同的自然语言语法、语义的中间语言至少目前还是未知数。此外,中间语言能不能把各种语言的所有特征保留下来,又能很好生成对应的各种语言也是问题。所以, 构造中间语言是一个巨大、复杂的工程, 还包含许多理论研究,迄今为止的探索还没有好的答案

第 4 章机器翻译方法然而，中间语言的机器翻译方法也常遭到怀疑。因为是否能够构造出表示各种不同的自然语言语法、语义的中间语言至少目前还是未知数。此外，中间语言能不能把各种语言的所有特征保留下来，又能很好生成对应的各种语言也是问题。所以，构造中间语言是一个巨大、复杂的工程，还包含许多理论研究，迄今为止的探索还没有好的答案

第4章机器翻译方法 4.1.3基于统计的机器翻译方法基于统计的机器翻译方法,一般不要任何语言学知识,它的基本原理是实现源语言词汇到目标语言词汇的映射。其思路受到语音识别研究的启发,因而应用了类似的方法来实现。研究者用大规模的双语语料库作为基础,对源语言和目标语言词汇的对应关系进行统计,根据统计规律输出译文。这种方法没有使用语言知识,主要特征是概率统计与随机过程的方法成为了分析和生成过程的唯一方法。它的主要内容是双语句对的对齐, 通过词汇同现的可能性来计算一种语言的一个词映射到另一种语言的一个词(或两个、零个词)的概率。应该说,基于统计的机器翻译方法的出现改变了机器翻译研究的面貌,从而开始了机器翻译研究的新阶段。不过,有些学者也对纯统计方法提出了异议,认为必须引入高层语法、语义模型,显然这是正确的。否则,基于统计的机器翻译方法不可能产生高质量

第 4 章机器翻译方法基于统计的机器翻译方法，一般不要任何语言学知识，它的基本原理是实现源语言词汇到目标语言词汇的映射。其思路受到语音识别研究的启发，因而应用了类似的方法来实现。研究者用大规模的双语语料库作为基础，对源语言和目标语言词汇的对应关系进行统计，根据统计规律输出译文。这种方法没有使用语言知识，主要特征是概率统计与随机过程的方法成为了分析和生成过程的唯一方法。它的主要内容是双语句对的对齐，通过词汇同现的可能性来计算一种语言的一个词映射到另一种语言的一个词（或两个、零个词）的概率。应该说，基于统计的机器翻译方法的出现改变了机器翻译研究的面貌，从而开始了机器翻译研究的新阶段。不过，有些学者也对纯统计方法提出了异议，认为必须引入高层语法、语义模型，显然这是正确的。否则，基于统计的机器翻译方法不可能产生高质量。 4.1.3 基于统计的机器翻译方法

6A第4章机器翻译方法统计方法最先在语音识别领域取得了成功。由于当前计算机在运算速度和存储容量方面都有巨大的提高, 可以获取大量的机读语料库,因此在机器翻译中应用统计方法的条件已经成熟。机器翻译的噪声通道模型可以视作最早的机器翻译思想的某中复活,其思路可以这样理解: 假设说话者已经用目标语想好了一句话T,但是说出的却是源语言句子S。这样一个过程可以看成为编码过程。而统计的机器翻译就是要从S回推T,可以看成解码过程。这样,统计的机器翻译任务分为两个部分:一是建模,即建立翻译的计算方法以及从双语语料库中估计模型的参数;二是解码,即寻求一种高效搜索算法取有关概率计算的最大值

第 4 章机器翻译方法统计方法最先在语音识别领域取得了成功。由于当前计算机在运算速度和存储容量方面都有巨大的提高，可以获取大量的机读语料库，因此在机器翻译中应用统计方法的条件已经成熟。机器翻译的噪声通道模型可以视作最早的机器翻译思想的某中复活，其思路可以这样理解：假设说话者已经用目标语想好了一句话T，但是说出的却是源语言句子S。这样一个过程可以看成为编码过程。而统计的机器翻译就是要从S回推T，可以看成解码过程。这样，统计的机器翻译任务分为两个部分：一是建模，即建立翻译的计算方法以及从双语语料库中估计模型的参数；二是解码，即寻求一种高效搜索算法取有关概率计算的最大值

6A第4章机器翻译方法在概率计算的前后,转换是进行有关预处理和后处理,例如句子当中的日期、时间、数字人名等应该用适当的类别标志加以替换,以便更好地进行计算,计算后再换回来。因为这类词不属于一般的词汇,单词本身在语料库中的出现缺乏代表性。建模就是设计各个模型的计算公式。因为直接计算某个句子出现的概率是比较困难的,语料库不可能足够大到包含所有句子,必须进行合理的、适当的简化。这是统计方法的特点,所得到的结果是近似值,但是因为概率本身就不是精确的,所以这些近似完全可以接受

第 4 章机器翻译方法在概率计算的前后，转换是进行有关预处理和后处理，例如句子当中的日期、时间、数字、人名等应该用适当的类别标志加以替换，以便更好地进行计算，计算后再换回来。因为这类词不属于一般的词汇，单词本身在语料库中的出现缺乏代表性。建模就是设计各个模型的计算公式。因为直接计算某个句子出现的概率是比较困难的，语料库不可能足够大到包含所有句子，必须进行合理的、适当的简化。这是统计方法的特点，所得到的结果是近似值，但是因为概率本身就不是精确的，所以这些近似完全可以接受

点击进入文档下载页（PPT格式）

共56页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第3章产生式系统及其搜索方法
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第2章相关知识表示方法
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第1章总论（杨宪泽）
MIS《管理信息系统概论》教材PPT教学课件（主编：张宽海，共六章）
《LaTeX2e1》参考书籍PDF电子版：第九章错误消息
《LaTeX2e1》参考书籍PDF电子版：第八章高级功能
《LaTeX2e1》参考书籍PDF电子版：第七章用户定制TEX
《LaTeX2e1》参考书籍PDF电子版：第六章图形
《LaTeX2e1》参考书籍PDF电子版：第五章数学公式
《LaTeX2e1》参考书籍PDF电子版：第四章显示文本
《LaTeX2e1》参考书籍PDF电子版：第三章文档的布局与组织
《LaTeX2e1》参考书籍PDF电子版：第二章命令与环境
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第5章单词与词组的处理与分析
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第6章句法（语法）与语义理论及分析
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）第7章相关机器学习
西南师范大学精品课程：《人工智能与机器翻译》课程教学资源（PPT课件）习题（杨宪泽）
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第一讲课程概述（主讲：金芝）
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第二讲需求工程的基本原理
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第三讲需求工程的方法
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第四讲需求抽取（1/2）传统的方法、交谈和问卷、情景、目标和用例
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第五讲需求抽取（2/2）认知的方法、上下文方法、民族学作为一种需求工程技术
中国科学院数学与系统科学研究院：《需求工程》课程教学资源（PPT课件讲稿）第六讲需求建模
荆门职业技术学院：《Visual FoxPro 6.0程序设计》课程教学资源（PPT课件）第1章 Visual FoxPro6.0概述
荆门职业技术学院：《Visual FoxPro 6.0程序设计》课程教学资源（PPT课件）第2章 VFP的基本操作方法

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录