人工智能与机器翻译 机器翻译部分 主讲:杨宪泽
人工智能与机器翻译 ——机器翻译部分 主讲:杨宪泽
6A第4章机器翻译方法 第4章机器翻译方法 机器翻译的处理对象是自然语言,而人类 对于语言认知的过程还未研究清楚,因此,要 实现理想、高质量的机器翻译至少目前还有较 大的距离。机器翻译是21世纪要解决的科技难 题之一,主要困难是自然语言在各个层次上的 歧义性。解决歧义问题很难从根本上突破,它 将涉及到处理的难度和翻译的速度,翻译的复 杂性,因此,寻求简单的翻译方法是一个重要 课题,它可以降低歧义处理难度,增加解决这 科技难题的希望
第 4 章 机器翻译方法 机器翻译的处理对象是自然语言,而人类 对于语言认知的过程还未研究清楚,因此,要 实现理想、高质量的机器翻译至少目前还有较 大的距离。机器翻译是21世纪要解决的科技难 题之一,主要困难是自然语言在各个层次上的 歧义性 。解决歧义问题很难从根本上突破,它 将涉及到处理的难度和翻译的速度,翻译的复 杂性,因此,寻求简单的翻译方法是一个重要 课题,它可以降低歧义处理难度,增加解决这 一科技难题的希望。 第 4 章 机器翻译方法
第4章机器翻译方法 自然语言的机器翻译目前一般以句子为翻译 单位。句子又分为句、短语、词三个层次。分析 阶段一般分为词法分析、句法分析、语义分析 语境分析、语用分析等,其中以词法分析和句法 分析为主。 面对这么多而复杂的分析模块(机器翻译中 每一种分析组成一个软件模块),面对这么庞大 的软件系统,研究者必须有清晰的思维、正确的 切入点,才可能把翻译软件设计得好一些,再好 基于这样的认识,本章将首先讨论现有的 机器翻译方法,并把重点放在基于实例的机器翻 译上
第 4 章 机器翻译方法 自然语言的机器翻译目前一般以句子为翻译 单位。句子又分为句、短语、词三个层次。分析 阶段一般分为词法分析、句法分析、语义分析、 语境分析、语用分析等,其中以词法分析和句法 分析为主。 面对这么多而复杂的分析模块(机器翻译中, 每一种分析组成一个软件模块),面对这么庞大 的软件系统,研究者必须有清晰的思维、正确的 切入点,才可能把翻译软件设计得好一些,再好 一些。基于这样的认识,本章将首先讨论现有的 机器翻译方法,并把重点放在基于实例的机器翻 译上
6A第4章机器翻译方法 4.1机器翻译的四种实现方法 4.1.1基于分析和转换的机器翻译方法 人作翻译时,把一个源语言句子译成目标语言句子,涉及 到四个基本操作:目标语言单词的检索、调序、删词、增词;机 器翻译系统的操作过程也不例外,有检索、分析、转换和生成的 主要四个阶段。这被称为基于分析和转换的机器翻译系统。也被 认为是模拟人类翻译活动最恰当的机制。 基于分析和转换的机器翻译方法就是自动实现源语言到目标 语言的转换,它采取了一系列的分析和转换的生成层次,使 源语言句子经过不同的中间表达形式,最终达到目标语言句子的 表示。其目的是尽可能地加深对源语言的理解,生成尽可能恰当 的目标语言形式。这种方法比较全面地体现了语言学知识在机器 翻译中的应用,是了解机器翻译实现过程的非常合适的模式
第 4 章 机器翻译方法 人作翻译时,把一个源语言句子译成目标语言句子,涉及 到四个基本操作:目标语言单词的检索、调序、删词、增词;机 器翻译系统的操作过程也不例外,有检索、分析、转换和生成的 主要四个阶段。这被称为基于分析和转换的机器翻译系统。也被 认为是模拟人类翻译活动最恰当的机制。 基于分析和转换的机器翻译方法就是自动实现源语言到目标 语言的转换,它采取了一系列的分析和转换的生成层次,使一个 源语言句子经过不同的中间表达形式,最终达到目标语言句子的 表示。其目的是尽可能地加深对源语言的理解,生成尽可能恰当 的目标语言形式。这种方法比较全面地体现了语言学知识在机器 翻译中的应用,是了解机器翻译实现过程的非常合适的模式。 4 . 1 机器翻译的四种实现方法 4 . 1 . 1 基于分析和转换的机器翻译方法
6A第4章机器翻译方法 在“机器翻译的常规步骤”实际上已经慨略 的介绍了这一方法的全过程,这里再补充阐述 些内容: 句子经过分析阶段之后,进入转换和生成阶 段。这两者一般联系得比较紧密,有时无法严格 区分,因为转换到目标语言也就是要生成目标语 言的词汇、短语、句子。可以把句子结构的转换 也就是源语言的句法树转换长合适的目标语言对 应形式当作转换,而后续的许多处理都当作生成 阶段的处理步骤看待
第 4 章 机器翻译方法 在“机器翻译的常规步骤”实际上已经慨略 的介绍了这一方法的全过程,这里再补充阐述一 些内容: 句子经过分析阶段之后,进入转换和生成阶 段。这两者一般联系得比较紧密,有时无法严格 区分,因为转换到目标语言也就是要生成目标语 言的词汇、短语、句子。可以把句子结构的转换 也就是源语言的句法树转换长合适的目标语言对 应形式当作转换,而后续的许多处理都当作生成 阶段的处理步骤看待