基于规则的自然语言处理方法 (理性方法,传统方法)
基于规则的自然语言处理方法 (理性方法,传统方法)
概述 口以规则形式表达语言知识。 口基于规则进行符号推理,从而实现语言信息处理。 口强调人对语言知识的理性整理(知识工程)。 受计算语言学理论指导。 口语言处理规则作为数据,它与程序分离,程序体现 为规则语言的解释器
概述 以规则形式表达语言知识。 基于规则进行符号推理,从而实现语言信息处理。 强调人对语言知识的理性整理(知识工程)。 受计算语言学理论指导。 语言处理规则作为数据,它与程序分离,程序体现 为规则语言的解释器
词法分析 口形态还原(针对英语、德语、法语等) ■把句子中的词还原成它们的基本词形(原形)。 口词性标注 ■为句子中的词标上预定义类别集合中的类。 口命名实体识别 ■识别出句子中的人名、地名、机构名等。 口分词(针对汉语、日语等) ■识别出句子中的词
词法分析 形态还原(针对英语、德语、法语等) ◼ 把句子中的词还原成它们的基本词形(原形)。 词性标注 ◼ 为句子中的词标上预定义类别集合中的类。 命名实体识别 ◼ 识别出句子中的人名、地名、机构名等。 分词(针对汉语、日语等) ◼ 识别出句子中的词
形态还原(英语) 口把句子中的词还原成原形,作为词的其它信息的 索引(词典、个性规则)。 口构词特点 ■屈折变化:词尾和词形变化,词性不变。如: study,studied,studied,studying speak,spoke,spoken,speaking ■派生变化:加前缀和后缀,词性发生变化。如: friend,friendly,friendship,... ■复合变化:多个单词以某种方式组合成一个词。 口还原规则 ■通用规则:变化有规律 ■个性规则:变化无规律
形态还原(英语) 把句子中的词还原成原形,作为词的其它信息的 索引(词典、个性规则)。 构词特点 ◼ 屈折变化:词尾和词形变化,词性不变。如: study, studied,studied,studying speak,spoke,spoken,speaking ◼ 派生变化:加前缀和后缀,词性发生变化。如: friend,friendly,friendship,... ◼ 复合变化:多个单词以某种方式组合成一个词。 还原规则 ◼ 通用规则:变化有规律 ◼ 个性规则:变化无规律
形态还原规则举例 口英语“规则动词”还原 ■*s->*(SINGULAR3) ■*es->*(SINGULAR3) *ies -*y (SINGULAR3) ■*ing->*(VING) ■*ing->*e(VING) ■ *ying -*ie (VING) ■*??ing->*?(VING) ■*ed->*(PAST)(VEN) *ed -*e (PAST)(VEN) *ied -*y (PAST)(VEN) *??ed ->*?(PAST)(VEN)
形态还原规则举例 英语“规则动词”还原 ◼ *s -> * (SINGULAR3) ◼ *es -> * (SINGULAR3) ◼ *ies -> *y (SINGULAR3) ◼ *ing -> * (VING) ◼ *ing -> *e (VING) ◼ *ying -> *ie (VING) ◼ *??ing -> *? (VING) ◼ *ed -> * (PAST)(VEN) ◼ *ed -> *e (PAST)(VEN) ◼ *ied -> *y (PAST)(VEN) ◼ *??ed -> *? (PAST)(VEN)