Pattern-Based cfG for mt 2 每个翻译模板由一个源语言上下文无关规则和一个目标 语言上下文无关规则(这两个规则称为翻译模板的骨 架),以及对这两个规则的中心词约束和链接约束构成; 中心词约束:对于上下文无关语法规则中右部(子结点) 的每个非终结符,可以指定其中心词;对于规则左部 (父结点)的非终结符,可以直接指定其中心词,也可 以通过使用相同的序号规定其中心词等于其右部的某个 非终结符的中心词; ■链接约束:源语言骨架和目标语言骨架的非终结符子结 点通过使用相同的序号建立对应关系,具有对应关系的 终结符互为翻译。 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ
2021年2月1日5时18分 语言信息处理--机器翻译II 11 Pattern-Based CFG for MT 2 每个翻译模板由一个源语言上下文无关规则和一个目标 语言上下文无关规则(这两个规则称为翻译模板的骨 架),以及对这两个规则的中心词约束和链接约束构成; 中心词约束:对于上下文无关语法规则中右部(子结点) 的每个非终结符,可以指定其中心词;对于规则左部 (父结点)的非终结符,可以直接指定其中心词,也可 以通过使用相同的序号规定其中心词等于其右部的某个 非终结符的中心词; 链接约束:源语言骨架和目标语言骨架的非终结符子结 点通过使用相同的序号建立对应关系,具有对应关系的 非终结符互为翻译
Pattern-Based cfg for mt 3 中心词约束链接约束 S:2→NP:1岁:MP:2 S: be >NP: 1 be year: NP: 2 old 中心词约束链接约束 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ
2021年2月1日5时18分 语言信息处理--机器翻译II 12 Pattern-Based CFG for MT 3
Pattern-Based cfg for mt 3 ■翻译的过程分为三步: 使用源语言CFG骨架分析输入句子S 应用源语言到目标语言的CFG骨架的链接约束,生成一个译文 CFG推导序列 根据译文CFG推导序列产生译文 ■模板排序的启发式原则: 对于源文CFG骨架相同的模板,有中心词约束的模板优先于没有 中心词约束的模板; 对于同一跨度上的两个结点,比较其对应的模板的源文CFG骨架, 非终结符少的模板优先于非终结符多的模板; 中心词约束被满足的结点优先于中心词约束不被满足的结点; 对于一个输入串而言,分析步骤越短(推导序列越短)越优先。 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ 13
2021年2月1日5时18分 语言信息处理--机器翻译II 13 Pattern-Based CFG for MT 3 翻译的过程分为三步: – 使用源语言CFG骨架分析输入句子s – 应用源语言到目标语言的CFG骨架的链接约束,生成一个译文 CFG推导序列 – 根据译文CFG推导序列产生译文 模板排序的启发式原则: – 对于源文CFG骨架相同的模板,有中心词约束的模板优先于没有 中心词约束的模板; – 对于同一跨度上的两个结点,比较其对应的模板的源文CFG骨架, 非终结符少的模板优先于非终结符多的模板; – 中心词约束被满足的结点优先于中心词约束不被满足的结点; – 对于一个输入串而言,分析步骤越短(推导序列越短)越优先
Pattern-Based cfG for mt 4 ■模板库的获取:假设T是一组翻译模板,B是双语 语料库,<S;>是一对互为翻译的句子 如果T能够翻译句子s为t,那么 do nothing; 如果T将s译为t"(不等于t),那么: ■如果T中存在<s,t>的推导Q,但这个推导不是最优 解,那么给Q中的模板进行实例化; ■如果不存在这种推导,那么加入适当的模板,使 得推导成立; 如果根本无法翻译S(分析失败),那么将<s,t>直接加 入到模板库中 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ 14
2021年2月1日5时18分 语言信息处理--机器翻译II 14 Pattern-Based CFG for MT 4 模板库的获取:假设T是一组翻译模板,B是双语 语料库,<s,t>是一对互为翻译的句子 – 如果T能够翻译句子s为t,那么do nothing; – 如果T将s译为t'(不等于t),那么: 如果T中存在<s,t>的推导Q,但这个推导不是最优 解,那么给Q中的模板进行实例化; 如果不存在这种推导,那么加入适当的模板,使 得推导成立; – 如果根本无法翻译s(分析失败),那么将<s,t>直接加 入到模板库中
模板的自动提取 利用一对实例进行泛化 Jaime g. carbonell. ralf d, brown generalized Example-Based Machine Translation http://www.iti.cs.cmu.edu/research/gEbmt/ 利用两对实例进行比较 H. Altay Guvenir, Ilyas Cicekli, Learning Translation Templates from EXamples Information Systems, 1998 张健,基于实例的机器翻译的泛化方法研究,中科院 计算所硕士论文,2001 2021年2月1日5时18分 语言信息处理-机器翻译Ⅱ 15
2021年2月1日5时18分 语言信息处理--机器翻译II 15 模板的自动提取 利用一对实例进行泛化 – Jaime G. Carbonell, Ralf D. Brown, Generalized Example-Based Machine Translation http://www.lti.cs.cmu.edu/Research/GEBMT/ 利用两对实例进行比较 – H. Altay Guvenir, Ilyas Cicekli, Learning Translation Templates from Examples Information Systems, 1998 – 张健,基于实例的机器翻译的泛化方法研究,中科院 计算所硕士论文,2001