机器翻译‖l Machine Translation l 张宇 哈尔滨工业大学计算机科学与技术学院 Zhangyu@irhit.edu.cn
机器翻译II Machine Translation II 张宇 哈尔滨工业大学计算机科学与技术学院 zhangyu@ir.hit.edu.cn
大纲 基于翻译记忆的机器翻译方法 ■基于模板(模式)的机器翻译方法 ■双语语料库对齐技术 句子对齐 词语对齐 ■机器翻译的评价 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ
2021年2月1日5时18分 语言信息处理--机器翻译II 2 大纲 基于翻译记忆的机器翻译方法 基于模板(模式)的机器翻译方法 双语语料库对齐技术 – 句子对齐 – 词语对齐 机器翻译的评价
翻译记忆方法1 ■翻译记忆方法( Translation Memory)是基于实 例方法的特例; ■也可以把基于实例的方法理解为广义的翻译记忆 方法; ■翻译记忆的基本思想: 把已经翻译过的句子保存起来 翻译新句子时,直接到语料库中去查找 如果发现相同的句子,直接输出译文 否则交给人去翻译,但可以提供相似的句子的参考译文 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ
2021年2月1日5时18分 语言信息处理--机器翻译II 3 翻译记忆方法1 翻译记忆方法(Translation Memory)是基于实 例方法的特例; 也可以把基于实例的方法理解为广义的翻译记忆 方法; 翻译记忆的基本思想: – 把已经翻译过的句子保存起来 – 翻译新句子时,直接到语料库中去查找 如果发现相同的句子,直接输出译文 否则交给人去翻译,但可以提供相似的句子的参考译文
翻译记忆方法2 ■翻译记忆方法主要被应用于计算机辅助翻 译(CAT)软件中 ■翻译记忆方法的优缺点 翻译质量有保证 随着使用时间匹配成功率逐步提高 特别适用于重复率高的文本翻译,例如公司的 品说明书的新版本翻译 与语言无关,适用于各种语言对 缺点是匹配成功率不高,特别是刚开始使用时 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ
2021年2月1日5时18分 语言信息处理--机器翻译II 4 翻译记忆方法2 翻译记忆方法主要被应用于计算机辅助翻 译(CAT)软件中 翻译记忆方法的优缺点 – 翻译质量有保证 – 随着使用时间匹配成功率逐步提高 – 特别适用于重复率高的文本翻译,例如公司的 产品说明书的新版本翻译 – 与语言无关,适用于各种语言对 – 缺点是匹配成功率不高,特别是刚开始使用时
翻译记忆方法3 ■计算机辅助翻译(CAT)软件已经形成了比较成熟的产业 TRADOS ■号称占有国际CAT市场的70% Microsoft、 Siemens、SAP等国际大公司和一些著名的国际组织都是 其用户 雅信CAT 适合中国人的习惯 产品已比较成熟 国际组织:L|SA( Localisation Industry Standards Association) ■面向用户:专业翻译人员 ■数据交换:LSA制定了TMX( Translation Memory eXchange)标准。 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ 5
2021年2月1日5时18分 语言信息处理--机器翻译II 5 翻译记忆方法3 计算机辅助翻译(CAT)软件已经形成了比较成熟的产业 – TRADOS 号称占有国际CAT市场的70% Microsoft、Siemens、SAP等国际大公司和一些著名的国际组织都是 其用户 – 雅信CAT 适合中国人的习惯 产品已比较成熟 – 国际组织: LISA(Localisation Industry Standards Association) 面向用户:专业翻译人员 数据交换:LISA制定了TMX(Translation Memory eXchange)标准