当前位置：和泉文库 > 计算机 > 浏览文档

哈尔滨工业大学：《语言信息处理》课程教学资源（PPT课件讲稿）机器翻译 II Machine Translation II

基于翻译记忆的机器翻译方法基于模板（模式）的机器翻译方法双语语料库对齐技术 – 句子对齐 – 词语对齐机器翻译的评价

文件格式：PPT，文件大小：573.5KB，售价：17.46元

文档详细内容（约64页）

通过泛化实例得到翻译模板 ■已有实例: Karl Marx was born in Trier, Germany in May 5, 1818 卡尔马克思于1818年5月5日出生在德国特里尔城。泛化: <Person> was born in <City> in <Date> < Person>于<Date>出生在<Ciy> 对齐 <Person>+<Person> <City> <<City> <Date><)<City> 2021年2月1日5时18分语言信息处理-机器翻译Ⅱ 16

2021年2月1日5时18分语言信息处理--机器翻译II 16 通过泛化实例得到翻译模板已有实例： – Karl Marx was born in Trier, Germany in May 5, 1818. – 卡尔·马克思于1818年5月5日出生在德国特里尔城。泛化： – <Person> was born in <City> in <Date> – <Person>于<Date>出生在<City> 对齐 – <Person> ↔ <Person> – <City> ↔ <City> – <Date> ↔ <City>

通过比较实例得到翻译模板已有两对翻译实例: 我给玛丽一支笔 I gave Mary a pen 我给汤姆一本书 I gave Tom a book 双侧单语句子分别比较,得到: 我给#一#Y#Z|gve#Wa#U ■查找变量的对应关系: #X←→# #Y台→q #Z←→# 2021年2月1日5时18分语言信息处理-机器翻译Ⅱ

2021年2月1日5时18分语言信息处理--机器翻译II 17 通过比较实例得到翻译模板已有两对翻译实例： – 我给玛丽一支笔 ↔ I gave Mary a pen. – 我给汤姆一本书 ↔ I gave Tom a book. 双侧单语句子分别比较，得到： – 我给#X 一#Y #Z ↔ I give #W a #U. 查找变量的对应关系： – #X ↔ #W – #Y ↔ φ – #Z ↔ #U

实例库的匹配1 ■实例匹配的目的是将输入句子分解成语料库中实例片断的组合,这是基于实例的机器翻译的关键问题之一,实例匹配的各种方法有很大的差异还没有那种做法显示出明显的优势; ■实例库匹配的效率问题:由于实例库规模较大, 通常需要建立倒排索引; ■实例库匹配的其他问题: 实例片断的分解实例片断的组合: 2021年2月1日5时18分语言信息处理-机器翻译Ⅱ 18

2021年2月1日5时18分语言信息处理--机器翻译II 18 实例库的匹配1 实例匹配的目的是将输入句子分解成语料库中实例片断的组合，这是基于实例的机器翻译的关键问题之一，实例匹配的各种方法有很大的差异，还没有那种做法显示出明显的优势；实例库匹配的效率问题：由于实例库规模较大，通常需要建立倒排索引；实例库匹配的其他问题： – 实例片断的分解： – 实例片断的组合：

实例库的匹配2 实例片断的分解实例库中的句子往往太长,直接匹配成功率太低,为了提高实例的重用性,需要将实例库中的句子分解为片断几种通常的做法: ■按标点符号分解 ■任意分解 ■通过组块分析进行分解 2021年2月1日5时18分语言信息处理-机器翻译Ⅱ 19

2021年2月1日5时18分语言信息处理--机器翻译II 19 实例库的匹配2 实例片断的分解 – 实例库中的句子往往太长，直接匹配成功率太低，为了提高实例的重用性，需要将实例库中的句子分解为片断 – 几种通常的做法：按标点符号分解任意分解通过组块分析进行分解

实例库的匹配3 实例片断的组合个被翻译的句子,往往可以通过各种不同的实例片断进行组合,如何选择一个最好的组合? 简单的做法 ■最大匹配 ■最大概率法:选择概率乘积最大的片断组合有点像汉语词语切分问题 2021年2月1日5时18分语言信息处理-机器翻译Ⅱ 20

2021年2月1日5时18分语言信息处理--机器翻译II 20 实例库的匹配3 实例片断的组合 – 一个被翻译的句子，往往可以通过各种不同的实例片断进行组合，如何选择一个最好的组合？ – 简单的做法：最大匹配最大概率法：选择概率乘积最大的片断组合 – 有点像汉语词语切分问题

点击进入文档下载页（PPT格式）

共64页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

Gas Systems Modeling andSimulation with MSC.EASY5：GD Advanced Class Notes（EAS105 Course Notes）
《计算机网络 Computer Networking》课程教学资源（PPT课件讲稿，英文版）Chapter 6 Wireless and Mobile Networks
《图像处理与计算机视觉 Image Processing and Computer Vision》课程教学资源（PPT课件讲稿）Chapter 08 Stereo vision
《计算机文化基础》课程教学大纲 Computer Culture Foundation
《高级语言程序设计》课程教学资源（试卷习题）试题五（无答案）
大连工业大学：《计算机程序设计（C语言版）》课程教学资源（PPT课件讲稿，共十三章）
《Visual Basic 6.0程序设计》课程教学资源（PPT课件）第四章常用控件与窗体
厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，2017）第11章图计算
《计算机导论》课程教学资源（PPT课件讲稿）第9章计算机学科方法论
VB.Net程序设计基础（PPT课件讲稿）
《计算机网络》课程教学资源（PPT课件）第4讲以太网组网及故障排除
《编译原理》课程教学资源（PPT课件讲稿）第二章词法分析
四川大学：《操作系统 Operating System》课程教学资源（PPT课件讲稿）Chapter 3 Process Description and Control 3.1 What is a Process 3.2 Process States 3.3 Process Description
《计算机应用基础》课程教学资源（PPT课件讲稿）第四章电子表格软件（Excel 2003）
《计算机文化基础》课程教学资源（PPT课件讲稿）第七章计算机网络基础
大数据集成（PPT讲稿）Big Data Integration
中国科学技术大学：《嵌入式操作系统 Embedded Operating Systems》课程教学资源（PPT课件讲稿）第四讲 CPU调度（part II）
西安电子科技大学：《计算机通信网》课程教学资源（PPT课件讲稿）第1章概述（宋锐）
西安交通大学：《网络与信息安全》课程PPT教学课件（网络入侵与防范）第六章网络入侵与防范——拒绝服务攻击与防御技术
《高级人工智能 Advanced Artificial Intelligence》教学资源（PPT讲稿）Lecture 7 Recurrent Neural Network
南京大学：《编译原理》课程教学资源（PPT课件讲稿）第七章运行时刻环境
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第6章 Data-Level Parallelism in Vector, SIMD, and GPU Architectures
河南中医药大学（河南中医学院）：《计算机网络》课程教学资源（PPT课件讲稿）第六章应用层
媒体服务（PPT课件讲稿）Media Services

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录