机器翻译 Machine Translation 张宇 哈尔滨工业大学计算机科学与技术学院 Zhangyu@irhit.edu.cn
机器翻译I Machine Translation I 张宇 哈尔滨工业大学计算机科学与技术学院 zhangyu@ir.hit.edu.cn
大纲 机器翻译的历史 ■机器翻译的分类 ■机器翻译的范式 ■机器翻译的基本策略 ■基于规则的机器翻译方法 基于实例的机器翻译方法 2021年2月2日10时32分 语言信息处理-机器翻译l 2
2021年2月2日10时32分 语言信息处理--机器翻译I 2 大纲 机器翻译的历史 机器翻译的分类 机器翻译的范式 机器翻译的基本策略 基于规则的机器翻译方法 基于实例的机器翻译方法
机器翻译的历史 IW. J Hutchens, latest Development in MT Technology: Beginning a New Era in MT Research. In: Proceedings of machine Translation Summit-NV, Kobe, Japan, 1993 ■冯志伟,自动翻译,上海知识出版社,1987年 ■冯志伟,自然语言机器翻译新论,语文出版社, 1994年。 ■冯志伟,自然语言的计算机处理,上海外语教育 出版社,1996年。 2021年2月2日10时32分 语言信息处理-机器翻译l 3
2021年2月2日10时32分 语言信息处理--机器翻译I 3 W. J. Hutchens, latest Development in MT Technology: Beginning a New Era in MT Research. In : Proceedings of Machine Translation Summit-IV, Kobe, Japan, 1993. 冯志伟,自动翻译,上海知识出版社,1987年。 冯志伟,自然语言机器翻译新论,语文出版社, 1994年。 冯志伟,自然语言的计算机处理,上海外语教育 出版社,1996年。 机器翻译的历史
机器翻译的萌芽期(1) 关于用机器来进行语言翻译的想法,远在古希腊时代就有人提 出过了。 ■在17世纪,一些有识之士提出了采用机器词典来克服语言障碍 的想法。 笛卡儿( Descartes)和莱布尼兹( Leibniz)都试图在统一的 数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施( Athanasiuskircher)和贝希尔( Johann Joachim becher)等人都出版过这类的词典。由此开展了关于 “普遍语言”的运动。 维尔金斯( John wi|kins)在《关于真实符号和哲学语言的论 X)(An Essay towards a real character and Philosophical Language,1668)中提出的中介语( Interlingua)是这方面最著 名的成果,这种中介语的设计试图将世界上所有的概念和实体 都加以分类和编码,有规则地列出并描述所有的概念和实体, 并根据它们各自的特点和性质,给予不同的记号和名称。 2021年2月2日10时32分 语言信息处理-机器翻译l
2021年2月2日10时32分 语言信息处理--机器翻译I 4 机器翻译的萌芽期(1) 关于用机器来进行语言翻译的想法,远在古希腊时代就有人提 出过了。 在17世纪,一些有识之士提出了采用机器词典来克服语言障碍 的想法。 笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的 数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(AthanasiusKircher)和贝希尔(Johann Joachim Becher)等人都出版过这类的词典。由此开展了关于 “普遍语言”的运动。 维尔金斯(John Wilkins) 在《关于真实符号和哲学语言的论 文》(An Essay towards a Real Character and Philosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著 名的成果,这种中介语的设计试图将世界上所有的概念和实体 都加以分类和编码,有规则地列出并描述所有的概念和实体, 并根据它们各自的特点和性质,给予不同的记号和名称
机器翻译的萌芽期(2) ■本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼 GB. Artsoun)提出了用机器来进行语言翻译的想法, 并在1933年7月22日获得了一项“翻译机”的专利,叫做 机械脑”( mechanical brain)。 这种机械脑的存储装置可以容纳数千个字元,通过键盘后 面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用 来记录火车时刻表和银行的帐户,尤其适合于作机器词典。 在宽纸带上面,每一行记录了源语言的一个词项以及这个 词项在多种目标语言中的对应词项,在另外一条纸带上对 应的每个词项处,记录着相应的代码,这些代码以打孔来 表示。机械脑于1937年正式展出,引起了法国邮政、电 部门的兴趣。但是,由于不久爆发了第二次世界大战,阿 尔楚尼的机械脑无法安装使用。 2021年2月2日10时32分 语言信息处理-机器翻译l
2021年2月2日10时32分 语言信息处理--机器翻译I 5 机器翻译的萌芽期(2) 本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼 (G.B. Artsouni)提出了用机器来进行语言翻译的想法, 并在1933年7月22日获得了一项“翻译机”的专利,叫做 “机械脑”(mechanical brain)。 这种机械脑的存储装置可以容纳数千个字元,通过键盘后 面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用 来记录火车时刻表和银行的帐户,尤其适合于作机器词典。 在宽纸带上面,每一行记录了源语言的一个词项以及这个 词项在多种目标语言中的对应词项,在另外一条纸带上对 应的每个词项处,记录着相应的代码,这些代码以打孔来 表示。机械脑于1937年正式展出,引起了法国邮政、电信 部门的兴趣。但是,由于不久爆发了第二次世界大战,阿 尔楚尼的机械脑无法安装使用