形态还原(英语) 口把句子中的词还原成原形,作为词的其它信息的 索引(词典、个性规则)。 口构词特点 ■屈折变化:词尾和词形变化,词性不变。如: study,studied,studied,studying speak,spoke,spoken,speaking ■派生变化:加前缀和后缀,词性发生变化。如: friend,friendly,friendship,... ■复合变化:多个单词以某种方式组合成一个词。 口还原规则 ■通用规则:变化有规律 ■个性规则:变化无规律
形态还原(英语) 把句子中的词还原成原形,作为词的其它信息的 索引(词典、个性规则)。 构词特点 ◼ 屈折变化:词尾和词形变化,词性不变。如: study, studied,studied,studying speak,spoke,spoken,speaking ◼ 派生变化:加前缀和后缀,词性发生变化。如: friend,friendly,friendship,... ◼ 复合变化:多个单词以某种方式组合成一个词。 还原规则 ◼ 通用规则:变化有规律 ◼ 个性规则:变化无规律
形态还原规则举例 口英语“规则动词”还原 ■*s->*(SINGULAR3) ■*es->*(SINGULAR3) *ies -*y (SINGULAR3) ■*ing->*(VING) ■*ing->*e(VING) ■ *ying -*ie (VING) ■*??ing->*?(VING) ■*ed->*(PAST)(VEN) *ed -*e (PAST)(VEN) *ied -*y (PAST)(VEN) *??ed ->*?(PAST)(VEN)
形态还原规则举例 英语“规则动词”还原 ◼ *s -> * (SINGULAR3) ◼ *es -> * (SINGULAR3) ◼ *ies -> *y (SINGULAR3) ◼ *ing -> * (VING) ◼ *ing -> *e (VING) ◼ *ying -> *ie (VING) ◼ *??ing -> *? (VING) ◼ *ed -> * (PAST)(VEN) ◼ *ed -> *e (PAST)(VEN) ◼ *ied -> *y (PAST)(VEN) ◼ *??ed -> *? (PAST)(VEN)
口英语不规则动词还原 ■ went -go (PAST) ■ gone -go (VEN) sat->sit (PAST)(VEN)
英语不规则动词还原 ◼ went -> go (PAST) ◼ gone -> go (VEN) ◼ sat -> sit (PAST) (VEN)
形态还原算法 1.3 输入一个单词 2. 如果词典里有该词,输出该词及其属性,转4;否则,转3 3. 如果有该词的还原规则,并且,词典里有还原后的词,则 输出还原后的词及其属性,转4;否则,调用<未登录词 模块> 4. 如果输入中还有单词,转1;否则,结束。 练习1.实现一个英语单词还原工具。 (词典:http:/nlp.nju.edu.cn/T_Lecture/dic_ec.rar)
形态还原算法 1. 输入一个单词 2. 如果词典里有该词,输出该词及其属性,转4;否则,转3 3. 如果有该词的还原规则,并且,词典里有还原后的词,则 输出还原后的词及其属性,转4;否则,调用<未登录词 模块> 4. 如果输入中还有单词,转1;否则,结束。 练习 1. 实现一个英语单词还原工具。 (词典:http://nlp.nju.edu.cn/MT_Lecture/dic_ec.rar)
词性标注 口为句子中的词标上预定义类别集合中的类(词性), 为后续的句法/语义分析提供必要的信息。 ■ 标注体系(类别集合)的确定 ■标注方法
词性标注 为句子中的词标上预定义类别集合中的类(词性), 为后续的句法/语义分析提供必要的信息。 ◼ 标注体系(类别集合)的确定 ◼ 标注方法