机器翻译的复苏期(2) ■早在1957年,美国学者英格维(V. Yingve)在 《句法翻译的框架》( Framework for syntactic translation)一文中就指出,一个好的机器翻译系 统,应该分别地对原语和译语都作出恰如其分的 描写,这样的描写应该互不影响,相对独立。英 格维主张,机器翻译可以分为三个阶段来进行。 第一阶段:用代码化的结构标志来表示原语文句的结 构 第二阶段:把原语的结构标志转换为译语的结构标志: 第三阶段:构成译语的输出文句。 2021年2月2日10时32分 语言信息处理-机器翻译l
2021年2月2日10时32分 语言信息处理--机器翻译I 11 机器翻译的复苏期(2) 早在1957年,美国学者英格维(V. Yingve)在 《句法翻译的框架》(Framework for syntactic translation)一文中就指出,一个好的机器翻译系 统,应该分别地对原语和译语都作出恰如其分的 描写,这样的描写应该互不影响,相对独立。英 格维主张,机器翻译可以分为三个阶段来进行。 – 第一阶段:用代码化的结构标志来表示原语文句的结 构; – 第二阶段:把原语的结构标志转换为译语的结构标志; – 第三阶段:构成译语的输出文句
机器翻译的复苏期(3) ■这个时期机器翻译的另一个特点是语法 ( grammar)与算法( algorithm)分开。 早在1957年,英格维就提出了把语法与“机制” ( mechanism)分开的思想。英格维所说的“机 制”,实质上就是算法。所谓语法与算法分开, 就是要把语言分析和程序设计分开,程序设计工 作者提出规则描述的方法,而语言学工作者使用 这种方法来描述语言的规则。语法和算法分开, 是机器翻译技术的一大进步,它非常有利于程序 设计工作者与语言工作者的分工合作。 2021年2月2日10时32分 语言信息处理-机器翻译l
2021年2月2日10时32分 语言信息处理--机器翻译I 12 机器翻译的复苏期(3) 这个时期机器翻译的另一个特点是语法 (grammar)与算法(algorithm)分开。 早在1957年,英格维就提出了把语法与“机制” (mechanism)分开的思想。英格维所说的“机 制”,实质上就是算法。所谓语法与算法分开, 就是要把语言分析和程序设计分开,程序设计工 作者提出规则描述的方法,而语言学工作者使用 这种方法来描述语言的规则。语法和算法分开, 是机器翻译技术的一大进步,它非常有利于程序 设计工作者与语言工作者的分工合作
机器翻译的复苏期(4) 这个复苏期的机器翻译系统的典型代表是法国格勒诺布尔理科医科大学应用 数学研究所(MAG)自动翻译中心(CETA)的机器翻译系统。这个自动翻 译中心的主任沃古瓦(B. Vauquois)教授明确地提出,一个完整的机器翻译 过程可以分为如下六个步骤: (1)原语词法分析 (2)原语句法分析 3)原语译语词汇转换 (4)原语译语结构转换 (5)译语句法生成 (6)译语词法生成 其中,第一、第二步只与原语有关,第五、第六步只与译语有关,只有第三 第四步牵涉到原语和译语二者。 这就是机器翻译中的“独立分析-独立生成-相关转换”的方法。他们用这种研 制的俄法机器翻译系统,已经接近实用水平。 2021年2月2日10时32分 语言信息处理-机器翻译l 13
2021年2月2日10时32分 语言信息处理--机器翻译I 13 机器翻译的复苏期(4) 这个复苏期的机器翻译系统的典型代表是法国格勒诺布尔理科医科大学应用 数学研究所(IMAG)自动翻译中心(CETA)的机器翻译系统。这个自动翻 译中心的主任沃古瓦(B.Vauquois)教授明确地提出,一个完整的机器翻译 过程可以分为如下六个步骤: (1)原语词法分析 (2)原语句法分析 (3)原语译语词汇转换 (4)原语译语结构转换 (5)译语句法生成 (6)译语词法生成 其中,第一、第二步只与原语有关,第五、第六步只与译语有关,只有第三、 第四步牵涉到原语和译语二者。 这就是机器翻译中的“独立分析-独立生成-相关转换”的方法。他们用这种研 制的俄法机器翻译系统,已经接近实用水平
机器翻译的复苏期(5) 他们还根据语法与算法分开的思想,设计了一套机器翻译 软件 ARIANE78,这个软件分为ATEF, ROBRA, TRANSF 和 SYGMOR四个部分。语言工作者可以利用这个软件来 描述自然语言的各种规则。 ■ATEF是一个非确定性的有限状态转换器,用于原语词法 岔析,它的程底接收愿语文句作为输入,并提供出该文句 ■ ROBRA是一个树形图转换器,它的程序接收词法分析的 结果作为输入,借助语法规则对此进行运算,输出能表示 文句结构的树形图; ROBRA还可以按同样的方式实现结 构转换和句法生成 ■ TRANSF可借助与双语词典实现词汇转换; ■ SYGMOR是一个确定性的树-链转换器,它接收译语句法 生成的结果作为输入,并以字符链的形式提供出译文。 2021年2月2日10时32分 语言信息处理-机器翻译l 14
2021年2月2日10时32分 语言信息处理--机器翻译I 14 机器翻译的复苏期(5) 他们还根据语法与算法分开的思想,设计了一套机器翻译 软件ARIANE-78,这个软件分为ATEF, ROBRA, TRANSF 和SYGMOR四个部分。语言工作者可以利用这个软件来 描述自然语言的各种规则。 ATEF是一个非确定性的有限状态转换器,用于原语词法 分析,它的程序接收原语文句作为输入,并提供出该文句 中每个词的形态解释作为输出; ROBRA是一个树形图转换器,它的程序接收词法分析的 结果作为输入,借助语法规则对此进行运算,输出能表示 文句结构的树形图;ROBRA还可以按同样的方式实现结 构转换和句法生成; TRANSF可借助与双语词典实现词汇转换; SYGMOR是一个确定性的树-链转换器,它接收译语句法 生成的结果作为输入,并以字符链的形式提供出译文
机器翻译的复苏期(6δ) ■美国斯坦福大学威尔克斯(YA.Wiks)提出了 “优选语义学”( preference semantics),并在 此基础上设计了英法机器翻译系统。 这个系统特别强调在原语和译语生成阶段,都要 把语义问题放在第一位,英语的输入文句首先被 转换成某种一般化的通用的语义表示,然后再由 这种语义表示生成法语译文输出 ■由于这个系统的语义表示方法比较细致,能够解 决仅用句法分析方法难于解决的歧义、代词所指 等困难问题,译文质量较高。 2021年2月2日10时32分 语言信息处理-机器翻译l 15
2021年2月2日10时32分 语言信息处理--机器翻译I 15 机器翻译的复苏期(6) 美国斯坦福大学威尔克斯(Y.A. Wilks)提出了 “优选语义学”(preference semantics),并在 此基础上设计了英法机器翻译系统。 这个系统特别强调在原语和译语生成阶段,都要 把语义问题放在第一位,英语的输入文句首先被 转换成某种一般化的通用的语义表示,然后再由 这种语义表示生成法语译文输出。 由于这个系统的语义表示方法比较细致,能够解 决仅用句法分析方法难于解决的歧义、代词所指 等困难问题,译文质量较高