6A第4章机器翻译方法 实质上,机器翻译方法对语言的处理就是 在两种语言之间搭一座桥,实现一种语言到另 种语言意义等价的转换。它并非象自然语言 理解那样只是对一种语言的操作,只需作针对 种语言的分析。作为一个机器翻译系统,它 既要考虑源语言的语法和语义规律,也要考虑 目标语言的这方面规律,忽略了任何一方都是 不行的。也就是说,对于双语互译规律的发现 和应用才是机器翻译最本质的特征。所以,在 词、短语和句子这三个层次上寻找源语言的目 标语言翻译的等价物是机器翻译中转换与生成 的任务
第 4 章 机器翻译方法 实质上,机器翻译方法对语言的处理就是 在两种语言之间搭一座桥,实现一种语言到另 一种语言意义等价的转换。它并非象自然语言 理解那样只是对一种语言的操作,只需作针对 一种语言的分析。作为一个机器翻译系统,它 既要考虑源语言的语法和语义规律,也要考虑 目标语言的这方面规律,忽略了任何一方都是 不行的。也就是说,对于双语互译规律的发现 和应用才是机器翻译最本质的特征。所以,在 词、短语和句子这三个层次上寻找源语言的目 标语言翻译的等价物是机器翻译中转换与生成 的任务
6A第4章机器翻译方法 通常,机器翻译的硏究中将转换看做 整个翻译过程中的一个阶段。然而,在语 义结构上进行转换却是一种好的方式。语 义结构可以是跨语言的,有能力同时应用 于分析和生成。另一方面,当机器翻译系 统的翻译语言对扩展时,还可以应用于多 种不同的语言。但要注意,大规模的自然 语言语义描述相当复杂,因而在机器翻译 系统中的应用往往会受到限制,难以采用 这样的语义表示作为转换的基本结构
第 4 章 机器翻译方法 通常,机器翻译的研究中将转换看做 整个翻译过程中的一个阶段。然而,在语 义结构上进行转换却是一种好的方式。语 义结构可以是跨语言的,有能力同时应用 于分析和生成。另一方面,当机器翻译系 统的翻译语言对扩展时,还可以应用于多 种不同的语言。但要注意,大规模的自然 语言语义描述相当复杂,因而在机器翻译 系统中的应用往往会受到限制,难以采用 这样的语义表示作为转换的基本结构
6A第4章机器翻译方法 般情况下,分析以句法为主、语义 为辅,正确的句法结构转换加正确的词汇 译文可以从源语言向目标语言传递完整的 正确信息。因此,以句法结构转换附加上 定的语义信息,能够构成转换的基本层 次。不足之处是:因为句法分析的结果是 面向源语言的,而要生成合适的目标语言 译文,转换部分常常引入许多目标语言方 面的约束,使得转换规则变得复杂了
第 4 章 机器翻译方法 一般情况下,分析以句法为主、语义 为辅,正确的句法结构转换加正确的词汇 译文可以从源语言向目标语言传递完整的 正确信息。因此,以句法结构转换附加上 一定的语义信息,能够构成转换的基本层 次。不足之处是:因为句法分析的结果是 面向源语言的,而要生成合适的目标语言 译文,转换部分常常引入许多目标语言方 面的约束,使得转换规则变得复杂了
6A第4章机器翻译方法 就标准的机器翻译系统来说,句子和短语 层次的结构转换是机器翻译转换部分的研究重 点。通常使用转换规则,就可以实现源语言句 法结构到目标语言句法结构的转换。这方面 般采用产生式方式的转换规则形式: S:S1+S2+.+S<C1C2.CK>→T1+T2+.:T 上式理解为:S是SL(源语言)的某个待 翻译单位(句子、短语等等),S1~Si是S中的 下一级组成单位;对于S,如果满足条件<C1 C2.Ck>,则TL(目标语言)中有T1~T译 文构成了相应的等价物T
第 4 章 机器翻译方法 就标准的机器翻译系统来说,句子和短语 层次的结构转换是机器翻译转换部分的研究重 点。通常使用转换规则,就可以实现源语言句 法结构到目标语言句法结构的转换。这方面一 般采用产生式方式的转换规则形式: S:S1+S2+…+Si<C1C2 …CK>→T1+T2+…+Tj :T 上式理解为:S是SL(源语言)的某个待 翻译单位(句子、短语等等),S1~Si是S中的 下一级组成单位;对于S,如果满足条件<C1 C2 … Ck>,则TL(目标语言)中有T1~Tj译 文构成了相应的等价物T
6A第4章机器翻译方法 这样的方法有两个特点:一是面向源 语言分析,因为源语言中的一个句子已经 由句法、语义分析等阶段分析完毕,生成 了关于源语言句子的某种中间表示,转换 以这种源语言中间表示作为输入;二是直 接转换,即对于S表示,直接给出译文形 式,一般不需要在目标语言内再作进一步 转换,T1~T可以直接包括目标语言的词 汇,也可以是对应于S1~S的译文组块
第 4 章 机器翻译方法 这样的方法有两个特点:一是面向源 语言分析,因为源语言中的一个句子已经 由句法、语义分析等阶段分析完毕,生成 了关于源语言句子的某种中间表示,转换 以这种源语言中间表示作为输入;二是直 接转换,即对于S表示,直接给出译文形 式,一般不需要在目标语言内再作进一步 转换,T1~Tj可以直接包括目标语言的词 汇,也可以是对应于S1~Si的译文组块