2018年1月 南师范大学学报 第16卷第1期 (对外汉语教学与研究版) 学社会科学学 Jan.,2018 Vol 16 No. 1 国内生成词库理论研究的回顾与展望 李强 (上海大学中文系,上海200444) [摘要]近些年来,生成词库论发展极为迅速,研究规模日益扩大。生成词库论视角下汉语研究 的相关工作也在不断向前推进,取得了不少值得关注的研究成果。文章对目前汉语方面的研究成果进 行回顾和总结,分别从语言本体、语言认知、语言计算和语言教学四个维度展示生成词库论在汉语上的 研究和应用。对于汉语中一些不好描写和解释的旧问题,生成词库能够提供一种新的观察视角,同时对 于扩大和深化汉语的相关研究课题也有一定的帮助。 [关键词]生成词库论;语言本体;语言认知;语言计算;语言教学 中图分类号:H14文献标识码:A文章编号:1672-1306(2018)01-0055-15 引言 兴起于20世纪90年代的生成词库理论( generative lexicon theory,GLT)被认为是“当代语义学中 最精细的形式化分析范式”①,由美国布兰代斯大学( Brandeis University) Pustejovsky教授创立。受亚 里士多德关于事物“ being”(存在)这一问題探讨的启发,他将目光聚焦到语言中的词语在动态语境下的 使用情况:为什么不同的词语在不同的语言环境下会产生不同的意义?不同词语之间是靠什么组合在 一起的?有没有一套普遍的描写和解释手段可以在人们的语言知识( anguage knowledge)和非语言知 识(即世界知识, world knowledge)之间建立起联系的纽带?基于对以上这些问题的思考, Pustejovsky 试图建立一套既能在语言理论方面建构模型,又能在语言应用方面解释实际问题的框架体系 生成词库创立至今已经有将近20年的时间,英语 WordNet的主要研制者 Fellbaum②曾给予生成 词库如下的评价:“自从乔姆斯基的《句法结构》问世以来,语言的生成性已被广泛认识,但直到 Pustejo- wsky的生成词库理论提出后,生成性观念才被运用到词库的研究中。”可见,生成词库在词汇研究这一 领域开创了一片新天地,开垦出了一片前人都未曾涉猎过的新沃土,以至于在 Geeraertsc所著的《The- ories of lexical semantics》一书中,专门用了11页(165~176)来对该理论进行介绍,足见该理论在词 汇语义研究中的重要地位 近年来生成词库论视角下的汉语研究取得了不少值得关注的研究成果。比如, Huang8. Ahrens@ 作者简介:李强,男,安徽巢湖人,上海大学讲师,研究方向为汉语语法学 基金项目:国家重点基础研究973计划项目“语言认知的神经机制”(2014CB340502);教育部人文社会科学重点研 究基地重大研究项目“汉语意合语法框架下的词汇语义知识表示及其计算系统研究”。 o Geeraerts, Dirk. Theories of Lexical Semantics[ M].New York: Oxford University Pr g Fellbaum. C. The Generative Lexicon by James Pustejovsky[J]. Language, 1997. (/ss Inc, 2010 @D Geeraerts, Dirk, Theo Lexical Semantics[M] ork: Oxford University Press Inc, 2010. Huang, C - 8. Ahrens, K Individuals, kinds and events: classifier coercion of nouns [J]. Language Sciences s Datal
2018年1月 第16卷第1期 云南师范大学学报 (对外汉语教学与研究版) Jan.,2018 Vol.16No.1 国内生成词库理论研究的回顾与展望 * 李 强 (上海大学 中文系,上海 200444) [摘 要] 近些年来,生成词库论发展极为迅速,研究规模日益扩大。生成词库论视角下汉语研究 的相关工作也在不断向前推进,取得了不少值得关注的研究成果。文章对目前汉语方面的研究成果进 行回顾和总结,分别从语言本体、语言认知、语言计算和语言教学四个维度展示生成词库论在汉语上的 研究和应用。对于汉语中一些不好描写和解释的旧问题,生成词库能够提供一种新的观察视角,同时对 于扩大和深化汉语的相关研究课题也有一定的帮助。 [关键词] 生成词库论;语言本体;语言认知;语言计算;语言教学 中图分类号: H14 文献标识码: A 文章编号: 1672-1306(2018)01-0055-15 一、引 言 兴起于20世纪90年代的生成词库理论(generativelexicontheory,GLT)被认为是“当代语义学中 最精细的形式化分析范式”①,由美国布兰代斯大学(BrandeisUniversity)Pustejovsky教授创立。受亚 里士多德关于事物“being”(存在)这一问题探讨的启发,他将目光聚焦到语言中的词语在动态语境下的 使用情况:为什么不同的词语在不同的语言环境下会产生不同的意义? 不同词语之间是靠什么组合在 一起的? 有没有一套普遍的描写和解释手段可以在人们的语言知识(languageknowledge)和非语言知 识(即世界知识,worldknowledge)之间建立起联系的纽带? 基于对以上这些问题的思考,Pustejovsky 试图建立一套既能在语言理论方面建构模型,又能在语言应用方面解释实际问题的框架体系。 生成词库创立至今已经有将近20年的时间,英语 WordNet的主要研制者 Fellbaum② 曾给予生成 词库如下的评价:“自从乔姆斯基的《句法结构》问世以来,语言的生成性已被广泛认识,但直到 Pustejovsky的生成词库理论提出后,生成性观念才被运用到词库的研究中。”可见,生成词库在词汇研究这一 领域开创了一片新天地,开垦出了一片前人都未曾涉猎过的新沃土,以至于在 Geeraerts③ 所著的《TheoriesofLexicalSemantics》一书中,专门用了11页(165~176)来对该理论进行介绍,足见该理论在词 汇语义研究中的重要地位。 近年来生成词库论视角下的汉语研究取得了不少值得关注的研究成果。比如,Huang & Ahrens④ * ① ② ③ ④ 作者简介:李 强,男,安徽巢湖人,上海大学讲师,研究方向为汉语语法学。 基金项目:国家重点基础研究973计划项目“语言认知的神经机制”(2014CB340502);教育部人文社会科学重点研 究基地重大研究项目“汉语意合语法框架下的词汇语义知识表示及其计算系统研究”。 Geeraerts,Dirk.TheoriesofLexicalSemantics[M].NewYork:OxfordUniversityPressInc,2010. Fellbaum,C.TheGenerativeLexiconbyJamesPustejovsky[J].Language,1997,(3). Geeraerts,Dirk.TheoriesofLexicalSemantics[M].NewYork:OxfordUniversityPressInc,2010. Huang,C-.R.& Ahrens,K.Individuals,kindsandevents:classifiercoercionofnouns[J].LanguageSciences, 2003,(25)
56 云南师范大学学报(对外汉语教学与研究版) 会科学学术期刊数据库 第16卷 以“强迫”为主线系统地描写了汉语中量词对名词的语义强迫现象; Liu et a.①、Lin8.Liu②讨论了汉语 中的动词强迫现象;张秀松③从生成词库角度解释了词的逻辑多义性问题;宋作艳④最为系统地利用生 成词库论来研究汉语中“事件强迫”( event coercion)。此外还包括袁野⑧、张秀松等Φ、李强⑦等的研究, 都从不同的角度层面对汉语中的相关语言现象进行了探讨。本文根据近些年的研究热点和方向着重介 绍生成词库论在汉语方面的研究,分别从语言本体、语言认知、语言计算和语言教学四个维度展示相关 研究成果。对于汉语中一些不好描写和解释的旧问题,生成词库能够提供一种新的观察视角,同时对于 扩大和深化汉语的相关研究课题也有一定的帮助 二、生成词库论概述 生成词库论的产生最初源于 Pustejovsky对常规多义关系的关注。比如 1)a. I put a glass on the table. b The present is made of glass. 上面两句中,a中的 glass(玻璃杯)是可数物体,而b中的 glass(玻璃)是不可数物体。所以, glass的这 两个意义就是一种常规的多义关系, Pustejovsky称此为“逻辑多义关系”( logical polysemy) 在处理这种多义关系上,传统的“词汇意义计算”( sense enumerative lexical,SEL)模式限定了每一 个词项α只有一个意义,从而排除了多义词的存在;也就是说,若词项a具有不同的意义,那么,该模式 就将α分解为α1、a2、a3…an,每一个α对应一个不同的意义。对此, Pustejovsky指出了其弊端,他认 为,从方法论上看,这种词义处理模式能够较好地解决词项在不同语言分布环境下产生不同的意义这 问题,尤其是能够对同一个动词和不同的名词组合时为什么能形成不同论元结构给出解释。但是,从词 库的角度来说,如果每一个不同的意义都负载于一个词项之上,那么该词库所包含的词项数量是非常巨 大的。我们不禁要问:人们究竟该如何学习并掌握如此大规模的词库? 所以,出于经济性( economy)和可学习性( learnability)的考虑,可以把这些不同意义归结于词语的 不同用法。那么,随即而来的一个问题是:词语如何在不同的语境下产生某一个特定的意义?甚至在某 些语境下词语可能获得一个全新的意义,这又是怎么实现的?为此,生成词库论主张词库不仅要列出词 语的意义,还要解释词语的动态性、创造性使用,主张词语的意义是组合的、动态的、生成的。作为个体 的词项,它的意义是相对稳定的,但进入到句子层面后,在上下文中可以获得一些创新性用法,而这些创 新性用法都可以通过若干程序获得,该程序提供了每个词项在该系统中的编码知识,主要是物性角色和 语义类型以及与该知识相联系的一些组合生成机制。 物性角色( qualia role)的提出源于亚里士多德的“四因说”( Aristotle’ s four causes of knowledge) 质料因、形式因、目的因和动力因。它是生成词库论中最为核心的内容,反映了人们对于事物的基本认 O Liu, Mei-chun, Chu-Ren Huang, Ching-Yi Lee. Lexical information and beyond constructional inferences in se- mantic representation[ R]. Proceedings of the 13th pacific asia conference on language, information and computation, 27 38.Taipei, Taiwan, 1999 Lin T.-H. Jonah and Liu C.-Y. Cecilia Coercion, Event structure, and syntax [3. Nanzan linguistics, 2004. (2) ③张秀松从生成词库论看汉语词的逻辑多义性[J.北方论丛,2008,(3). ④宋作艳生成词库理论与汉语事件强迫现象研究[M].北京:北京大学出版社,2015 ⑤袁野构式压制、转喻和广义转喻框架[.外国语言文学,2010,(3) ⑥张秀松,袁毓林,陈振宇,周强基于情境网络的汉语亲属名词的语义描写体系[世界汉语教学,2011,(3). ⑦李强从生成词库论看动词“写”与名词的组合[门云南师范大学学报(对外汉语教学与研究版),2015,(2)
以“强迫”为主线系统地描写了汉语中量词对名词的语义强迫现象;Liuetal.①、Lin& Liu② 讨论了汉语 中的动词强迫现象;张秀松③从生成词库角度解释了词的逻辑多义性问题;宋作艳④最为系统地利用生 成词库论来研究汉语中“事件强迫”(eventcoercion)。此外还包括袁野⑤、张秀松等⑥、李强⑦等的研究, 都从不同的角度层面对汉语中的相关语言现象进行了探讨。本文根据近些年的研究热点和方向着重介 绍生成词库论在汉语方面的研究,分别从语言本体、语言认知、语言计算和语言教学四个维度展示相关 研究成果。对于汉语中一些不好描写和解释的旧问题,生成词库能够提供一种新的观察视角,同时对于 扩大和深化汉语的相关研究课题也有一定的帮助。 二、生成词库论概述 生成词库论的产生最初源于 Pustejovsky对常规多义关系的关注。比如: 1)a.Iputaglassonthetable. b.Thepresentismadeofglass. 上面两句中,a中的glass(玻璃杯)是可数物体,而 b中的glass(玻璃)是不可数物体。所以,glass的这 两个意义就是一种常规的多义关系,Pustejovsky称此为“逻辑多义关系”(logicalpolysemy)。 在处理这种多义关系上,传统的“词汇意义计算”(senseenumerativelexical,SEL)模式限定了每一 个词项α只有一个意义,从而排除了多义词的存在;也就是说,若词项α具有不同的意义,那么,该模式 就将α分解为α1、α2、α3……αn,每一个α对应一个不同的意义。对此,Pustejovsky指出了其弊端,他认 为,从方法论上看,这种词义处理模式能够较好地解决词项在不同语言分布环境下产生不同的意义这一 问题,尤其是能够对同一个动词和不同的名词组合时为什么能形成不同论元结构给出解释。但是,从词 库的角度来说,如果每一个不同的意义都负载于一个词项之上,那么该词库所包含的词项数量是非常巨 大的。我们不禁要问:人们究竟该如何学习并掌握如此大规模的词库? 所以,出于经济性(economy)和可学习性(learnability)的考虑,可以把这些不同意义归结于词语的 不同用法。那么,随即而来的一个问题是:词语如何在不同的语境下产生某一个特定的意义? 甚至在某 些语境下词语可能获得一个全新的意义,这又是怎么实现的? 为此,生成词库论主张词库不仅要列出词 语的意义,还要解释词语的动态性、创造性使用,主张词语的意义是组合的、动态的、生成的。作为个体 的词项,它的意义是相对稳定的,但进入到句子层面后,在上下文中可以获得一些创新性用法,而这些创 新性用法都可以通过若干程序获得,该程序提供了每个词项在该系统中的编码知识,主要是物性角色和 语义类型以及与该知识相联系的一些组合生成机制。 物性角色(qualiarole)的提出源于亚里士多德的“四因说”(Aristotle’sfourcausesofknowledge): 质料因、形式因、目的因和动力因。它是生成词库论中最为核心的内容,反映了人们对于事物的基本认 ·56· 云南师范大学学报(对外汉语教学与研究版) 第16卷 ① ② ③ ④ ⑤ ⑥ ⑦ Liu,Mei-chun,Chu-Ren Huang,Ching-YiLee.Lexicalinformationandbeyond:constructionalinferencesinsemanticrepresentation[R].Proceedingsofthe13thpacificasiaconferenceonlanguage,informationandcomputation,27~ 38.Taipei,Taiwan,1999. LinT-.H.JonahandLiuC-.Y.Cecilia.Coercion,Eventstructure,andsyntax[J].Nanzanlinguistics,2004,(2). 张秀松.从生成词库论看汉语词的逻辑多义性[J].北方论丛,2008,(3). 宋作艳.生成词库理论与汉语事件强迫现象研究[M].北京:北京大学出版社,2015. 袁野.构式压制、转喻和广义转喻框架[J].外国语言文学,2010,(3). 张秀松,袁毓林,陈振宇,周强.基于情境网络的汉语亲属名词的语义描写体系[J].世界汉语教学,2011,(3). 李强.从生成词库论看动词“写”与名词的组合[J].云南师范大学学报(对外汉语教学与研究版),2015,(2)
第1期 李强:国内生成词库理论研究的回顾与展望 料学学术期.5 识和感知,主要涉及4个层面的语言知识( Pustejovsky1991,1995)① 构成角色( constitutive role):描写一个物体与其组成部分之间的关系; 形式角色( formal role):描写对象在更大的认知域内区别于其他对象的属性; 功用角色( telic role):描写对象的用途和功能; 施成角色( agentive role):描写对象怎样形成或产生的。 这4种物性角色弥合了语言知识与百科知识之间的缺口,从而为语言的可计算特征提供了一套百科知 识式的词汇描写方法。 就词语本身的性质而言, Pustejovsky(2001,2006)②根据词语所代表的意义内容构建了一个三分 ( tripartite)的知识分类体系,即语义类型,包括 自然类( natural type):与物性结构中的形式角色和构成角色相关的概念,谓词来自物质域。比如 石头、水、兔子、天空、树; 人造类( artifactual type):与物性结构中的施成角色和功用角色相关的概念,谓词与这两个角色联 系。比如:医生、妈妈、椅子、桌子、刀 合成类( complex type):常被称为“点对象”( dot object),由自然类和人造类组成的概念。比如:书 报纸、杂志、音乐会、唱片。 这样一种三分体系有别于语言计算领域常见的知识本体( ontology),比如 WordNet③,尤其对于事物实 体而言,构建上述分类系统能够将那些具有多义性的词语进行恰当的归类,从而将内在的不同义面(se- mantic facet)进行有效地表征。比如,“书”就是一个多义词,在“尽信书就不如无书”中,前一个“书”代 表信息内容,后一个“书”代表物质实体;所以,“书”应该被划入到合成类之中。而这在 WordNet是较难 处理的,“书”对应于 WordNet名词分类体系中的 artifactual;不过,这种分类很显然并没能将“书”的不 同义面区分开来。 在物性角色和语义类型的基础上,生成词库阐述了词项组合的几种不同机制,主要包括:纯粹类型 选择( pure type selection)、类型调节( type accommodation)和类型强迫( type coercion)( Pustejovsky 2001,2006,2011)。③其中,尤其值得注意的是“类型强迫”,它是指:“它是一种语义操作手段,能将论元 转变成一种功能函项(谓词)所需要的类型,否则就会出现类型匹配错误。” 在此基础上, Pustejovsky⑤对“类型强迫”做了更为具体和细致地扩展描写和分类,使之具有更强 的解释力。他将“类型强迫”分为两类,分别为“强迫引入”( coercion by introduction)和“强迫利用”(co- o Pustejovsky, J. The Generative Lexicon [J]. Computational linguistics, 1991,(4): Pustejovsky, J. The Generative xicon [M].Cambridge: MIT Press, 1995 o Pustejovsky, J Type Construction and the Logic of Concepts [A]. In Pierrette Bouillon &.F. Busa(Eds),The Language of Word Meaning[C]. Cambridge University Press, 2001: Pustejovsky, J. Type theory and lexical decomposition [J]Journal of Cognitive Science, 2006.(6) ③关于 WordNet的相关内容,可参考 Fellbaum,C.(ed.) WordNet: An Electronic Lexical Database[M]. Cambridge, Massachusetts: MIT Press, 1998. o Pustejovsky, J Type Construction and the Logic of Concepts[A]. In Pierrette Bouillon &.FBusa(Eds),The anguage of Word Meaning[C]. Cambridge University Press, 2001: Pustejovsky, J. Type theory and lexical decomposition [J] Journal of Cognitive Science, 2006, (6): Pustejovsky xtEt In a general theory of argument selection[J]. Lingusit- 6 Pustejovsky, J Coercion in a general theory of argument selection[J]. L. ingusitics, 2011, (6)
识和感知,主要涉及4个层面的语言知识(Pustejovsky1991,1995)①: 构成角色(constitutiverole):描写一个物体与其组成部分之间的关系; 形式角色(formalrole):描写对象在更大的认知域内区别于其他对象的属性; 功用角色(telicrole):描写对象的用途和功能; 施成角色(agentiverole):描写对象怎样形成或产生的。 这4种物性角色弥合了语言知识与百科知识之间的缺口,从而为语言的可计算特征提供了一套百科知 识式的词汇描写方法。 就词语本身的性质而言,Pustejovsky(2001,2006)② 根据词语所代表的意义内容构建了一个三分 (tripartite)的知识分类体系,即语义类型,包括: 自然类(naturaltype):与物性结构中的形式角色和构成角色相关的概念,谓词来自物质域。比如: 石头、水、兔子、天空、树; 人造类(artifactualtype):与物性结构中的施成角色和功用角色相关的概念,谓词与这两个角色联 系。比如:医生、妈妈、椅子、桌子、刀; 合成类(complextype):常被称为“点对象”(dotobject),由自然类和人造类组成的概念。比如:书、 报纸、杂志、音乐会、唱片。 这样一种三分体系有别于语言计算领域常见的知识本体(ontology),比如 WordNet③,尤其对于事物实 体而言,构建上述分类系统能够将那些具有多义性的词语进行恰当的归类,从而将内在的不同义面(semanticfacet)进行有效地表征。比如,“书”就是一个多义词,在“尽信书就不如无书”中,前一个“书”代 表信息内容,后一个“书”代表物质实体;所以,“书”应该被划入到合成类之中。而这在 WordNet是较难 处理的,“书”对应于 WordNet名词分类体系中的artifactual;不过,这种分类很显然并没能将“书”的不 同义面区分开来。 在物性角色和语义类型的基础上,生成词库阐述了词项组合的几种不同机制,主要包括:纯粹类型 选择(puretypeselection)、类型调节(typeaccommodation)和类型强迫(typecoercion)(Pustejovsky 2001,2006,2011)。④ 其中,尤其值得注意的是“类型强迫”,它是指:“它是一种语义操作手段,能将论元 转变成一种功能函项(谓词)所需要的类型,否则就会出现类型匹配错误。” 在此基础上,Pustejovsky⑤ 对“类型强迫”做了更为具体和细致地扩展描写和分类,使之具有更强 的解释力。他将“类型强迫”分为两类,分别为“强迫引入”(coercionbyintroduction)和“强迫利用”(co- 第1期 李 强: 国内生成词库理论研究的回顾与展望 ·57· ① ② ③ ④ ⑤ Pustejovsky,J.TheGenerativeLexicon [J].Computationallinguistics,1991,(4);Pustejovsky,J.TheGenerative Lexicon[M].Cambridge:MITPress,1995. Pustejovsky,J.TypeConstructionandtheLogicofConcepts[A].InPierretteBouillon & F.Busa (Eds.),The LanguageofWordMeaning[C].CambridgeUniversityPress,2001;Pustejovsky,J.Typetheoryandlexicaldecomposition [J].JournalofCognitiveScience,2006,(6). 关于 WordNet 的 相 关 内 容,可 参 考 Fellbaum,C.(ed.)WordNet:An Electronic LexicalDatabase [M]. Cambridge,Massachusetts:MITPress,1998. Pustejovsky,J.TypeConstructionandtheLogicofConcepts[A].InPierretteBouillon & F.Busa (Eds.),The LanguageofWordMeaning[C].CambridgeUniversityPress,2001;Pustejovsky,J.Typetheoryandlexicaldecomposition [J].JournalofCognitiveScience,2006,(6);Pustejovsky,J.Coercioninageneraltheoryofargumentselection[J].Lingusitics,2011,(6). Pustejovsky,J.Coercioninageneraltheoryofargumentselection[J].Lingusitics,2011,(6)
云南师范大学学报(对外汉语教学与研究版) 学社会科学学术期刊数据库 第16卷 ersion by exploitation)。 强迫引入( coercion by introduction):把论元包装成函项所要求的类型,这是通过引入名词的相关 物性角色实现的。 强迫利用( coercion by exploitation):提取论元类型的一部分来满足函项的要求,这是通过利用名 词的相关物性角色实现的 上述两种强迫机制可以解释下面的语言现象: 2)a. John enjoyed the book. b. Mary read thermon 在例2)a中,动词“ enjoy”在语义上要求它的宾语成分必须是动作性的,但“book”并不满足该语义要求, 于是,“enoy”强迫“bok”产生“ read the book”的语义解读,而这是通过利用“book”的功用角色“read” 实现的。这就是“强迫利用”。在例2)b中,动词“read”要求它的宾语必须具有phys(物质实体)的属性 特征;但是,名词 rumor却只有info(信息内容)的属性特征。于是,“read”可以直接将phys属性特征 引人到名词 rumor之上。这就是“强迫引入” 不同组合机制有效地解释了词项为什么能够组合在一起以及组合之后意义的生成性问题,特别是 对那些意义不完整( incomplete)或限定不足( under- specification)的句子而言,生成词库论提供了一种 解释手段,有力地说明了动态语境下词语意义的生成和变化以及句子最终浮现出合适语义表达的过程。 三、语言本体研究 运用生成词库论对汉语本体进行研究是目前关注度最大、研究成果最多的一块领域,其研究课题涉 及词语构造方式、语义组合与强迫和句法格式语义还原等内容 (一)词语构造方式 Song8.Zhao①和Song8.Qiu②利用生成词库论中的物性角色对汉语中的双音节和三音节复合词 进行了语义关系及语义信息的标注,总体上包括3种不同的情况: 1.复合词的一个语素是另一个语素的某种物性角色。比如,前一个语素是后一个语素的形式角色 包括“[玻璃]纸、[塑料]纸、[干]花、[喇叭]花”等;前一个语素是后一个语素的构成角色,包括“[油]纸 [砂]纸、桃]花、[玫瑰]花”等;前一个语素(如果是名素则隐含了一个动素)是后一个语素的功用角色 包括“[墙]纸、[复印]纸、[蒸]锅、[救护]车”;前一个语素(如果是名素则隐含了一个动素)是后一个语素 的施成角色,包括“[剪]纸、道林]纸、[石]灰”等。③ 2.在含有动词性语素的复合词中,动词性语素是整个复合词的某种物性角色。比如“石雕、冰雕、石 刻、木刻”中,动词性语素“雕、刻”是NV复合词的施成角色,“蒸锅、砍刀、救护车、饮用水”中的动词性语 素“蒸、砍、救护、饮用”是ⅤN复合词的功用角色,“作文、画像、炒面、来信”中的动词性语素“作、画、炒 来”是VN复合词的施成角色。 3.VN/NV/V动词性结构是VN/NV/VV式复合词的某个物性角色。比如,“管家、围墙、兜肚”, o Song Zuoyan & Zhao Qingqing Annotating Qualia Relations and Types in Chinese Compound nouns [J].Interna tional Journal of Knowledge and Language Processing, 2013, (3) Song Zuoyan & Qiu Likun Qualia Relations in Chinese Nominal Compounds Containing Verbal Elements [J].In- ternational Journal of Knowledg Ige and Language Processing, 2013.(1) ③“道林”是最早生产道林纸的公司,体现了这种纸的来源;“石灰”是石头煅烧而产生的,“煅烧石头”产生“灰
ercionbyexploitation)。 强迫引入(coercionbyintroduction):把论元包装成函项所要求的类型,这是通过引入名词的相关 物性角色实现的。 强迫利用(coercionbyexploitation):提取论元类型的一部分来满足函项的要求,这是通过利用名 词的相关物性角色实现的。 上述两种强迫机制可以解释下面的语言现象: 2)a.Johnenjoyedthebook. b.Maryreadtherumor. 在例2)a中,动词“enjoy”在语义上要求它的宾语成分必须是动作性的,但“book”并不满足该语义要求。 于是,“enjoy”强迫“book”产生“readthebook”的语义解读,而这是通过利用“book”的功用角色“read” 实现的。这就是“强迫利用”。在例2)b中,动词“read”要求它的宾语必须具有phys(物质实体)的属性 特征;但是,名词rumor却只有info(信息内容)的属性特征。于是,“read”可以直接将phys 属性特征 引入到名词rumor之上。这就是“强迫引入”。 不同组合机制有效地解释了词项为什么能够组合在一起以及组合之后意义的生成性问题,特别是 对那些意义不完整(incomplete)或限定不足(under-specification)的句子而言,生成词库论提供了一种 解释手段,有力地说明了动态语境下词语意义的生成和变化以及句子最终浮现出合适语义表达的过程。 三、语言本体研究 运用生成词库论对汉语本体进行研究是目前关注度最大、研究成果最多的一块领域,其研究课题涉 及词语构造方式、语义组合与强迫和句法格式语义还原等内容。 (一)词语构造方式 Song&Zhao① 和Song& Qiu② 利用生成词库论中的物性角色对汉语中的双音节和三音节复合词 进行了语义关系及语义信息的标注,总体上包括3种不同的情况: 1.复合词的一个语素是另一个语素的某种物性角色。比如,前一个语素是后一个语素的形式角色, 包括“[玻璃]纸、[塑料]纸、[干]花、[喇叭]花”等;前一个语素是后一个语素的构成角色,包括“[油]纸、 [砂]纸、[桃]花、[玫瑰]花”等;前一个语素(如果是名素则隐含了一个动素)是后一个语素的功用角色, 包括“[墙]纸、[复印]纸、[蒸]锅、[救护]车”;前一个语素(如果是名素则隐含了一个动素)是后一个语素 的施成角色,包括“[剪]纸、[道林]纸、[石]灰”等。③ 2.在含有动词性语素的复合词中,动词性语素是整个复合词的某种物性角色。比如“石雕、冰雕、石 刻、木刻”中,动词性语素“雕、刻”是 NV 复合词的施成角色,“蒸锅、砍刀、救护车、饮用水”中的动词性语 素“蒸、砍、救护、饮用”是 VN 复合词的功用角色,“作文、画像、炒面、来信”中的动词性语素“作、画、炒、 来”是 VN 复合词的施成角色。 3.VN/NV/VV 动词性结构是 VN/NV/VV 式复合词的某个物性角色。比如,“管家、围墙、兜肚”, ·58· 云南师范大学学报(对外汉语教学与研究版) 第16卷 ① ② ③ SongZuoyan&ZhaoQingqing.AnnotatingQualiaRelationsandTypesinChineseCompoundnouns[J].InternationalJournalofKnowledgeandLanguageProcessing,2013,(3). SongZuoyan& QiuLikun.QualiaRelationsinChineseNominalCompoundsContainingVerbalElements[J].InternationalJournalofKnowledgeandLanguageProcessing,2013,(1). “道林”是最早生产道林纸的公司,体现了这种纸的来源;“石灰”是石头煅烧而产生的,“煅烧石头”产生“灰
科学学术期刊数 第1期 李强:国内生成词库理论研究的回顾与展望 VN就是复合名词VN的功用角色;“剪纸、剪报”,VN就是复合名词VN的施成角色;“天赋、心得、火 烧”,NV就是复合名词NV的施成角色;“编辑、装饰、导演”,VV就是复合名词VV的功用角色,“雕 刻、记录”,VV就是复合名词VV的施成角色 Song8.Zhao更进一步地对隐喻式名名复合词进行了物性角色方面的考察。在名名复合词中 修饰语名词和中心语名词都可能会发生隐喻现象。比如,“楼”的形状像“塔”,所以称为“塔楼”;“耳朵” 和“大脑”的关系近似于“侧房”和“正房”的关系,所以“侧房”被称为“耳房”;“房子”的功能是提供居住的 处所,所以具备这一功能的车子被称为“房车”。这些名名复合词中的修饰语名词产生了隐喻义;并且, 这种隐喻义分别是在形式角色、构成角色和功用角色的基础上产生的。此外,中心语名词也会发生隐 喻。“雪”的形状像“花”,所以称为“雪花”;“脚”和“人”的关系近似于“页面底部”和“页面”的关系,所以 页面底部”称为“页脚”;小脑中有一块连接左右两侧的组织,因为功能类似于“桥”的连接作用,因此称 为“脑桥”。在这些名名复合词中,都是中心语名词产生了隐喻义;并且,这种隐喻义也同样分别是在形 式角色、构成角色和功能角色的基础上形成的 以生成词库视角来探讨汉语复合词构词语素之间的关系,这属于构词法领域的研究。这种研究有 别于我们传统上对于词语构造的一般性认识。过去的构词研究往往根据语素的数量将词语分为单纯词 和合成词,合成词进一步分为复合式合成词和派生式合成词,复合式里面再根据语素之间的语义语法关 系分为联合式、主谓式、述宾式等,派生式复合词再进一步研究词根和词缀之间的关系等。②这种关于 词语的构造研究大体上还是基于形式或形态上的,对于词语中不同语素之间的关系,特别是语义关系, 关注得还不够,而生成词库视角下的研究则在一定程度上弥补了这个方面的不足。 此外,按照物性角色可以对词语中的语素加以标注,进而将语素之间的语义关系清晰地表示出来; 通过对词语大规模的语义信息标注,可以在此基础上抽象出一套语素组合的模板,最终实现机器对词语 的自动语义分析和剖析。同时,在汉语作为第二语言的词汇教学领域,利用物性角色对词语所做的标注 可以用来说明和解释词语的意义,以便汉语学习者能更为清晰和透彻地掌握词语的意义。这些都是传 统的词义分析方法难以解决或者不好解决的问题。 (二)语义组合与强迫 语言成分的语义组合性问题一直以来都是语义学研究的重要课题。从生成词库论的角度来研究词 语的语义之间是如何组合在一起的,这是一个颇为新颖的尝试。 Wang8. Huang结合名词物性角色、语义类型和组合机制分别对汉语中的动词和形容词与名词 的组合进行了考察。在动名组合中,他们以动词“看”为例,尽可能多地搜集了“看NP”短语,然后根据 “看”的不同意义分为不同的情况,以不同的组合机制为条目依次对“看NP”进行了细致的研究。在形 名组合中,他们分两种情况:(1)说明形容词“长”可以修饰许多不同类型的名词,并且具有潜在的多义 o Song Zuoyan 8. Zhao Qingqing Qualia Relations in Metaphorical Noun-Noun Compounds[R]. Proceedings of the 6th International Conference on Generative Approaches to the Lexicon. September 24-25, Pisa, Italy, 2013. ②张斌现代汉语描写语法[M]北京:商务印书馆,2010 S Wang, Shan 8. Huang Chu-Ren Adjectival Modification to Nouns in Mandarin Chinese: Case Studies on"chang+ noun"and"adjective+tu shuguan"[R]. Proceedings of The 24th Pacific Asia Conference on Language, Information and Computation (PACLIC24 ). November 4-7. Sendai, Japan. 2010a: Wang, Shan 8. Huang Chu-Ren Compositional Operations of Mandarin Chinese perception Verb"kan". A Generative Lexicon Approach[ R]. Proceedings of the 24th Pa- cific Asia Conference on Language, Information and Computation (PACLIC 24). November 4-7, Sendai, Japan, 2010b
VN 就是复合名词 VN 的功用角色;“剪纸、剪报”,VN 就是复合名词 VN 的施成角色;“天赋、心得、火 烧”,NV 就是复合名词 NV 的施成角色;“编辑、装饰、导演”,VV 就是复合名词 VV 的功用角色,“雕 刻、记录”,VV 就是复合名词 VV 的施成角色。 Song& Zhao① 更进一步地对隐喻式名名复合词进行了物性角色方面的考察。在名名复合词中, 修饰语名词和中心语名词都可能会发生隐喻现象。比如,“楼”的形状像“塔”,所以称为“塔楼”;“耳朵” 和“大脑”的关系近似于“侧房”和“正房”的关系,所以“侧房”被称为“耳房”;“房子”的功能是提供居住的 处所,所以具备这一功能的车子被称为“房车”。这些名名复合词中的修饰语名词产生了隐喻义;并且, 这种隐喻义分别是在形式角色、构成角色和功用角色的基础上产生的。此外,中心语名词也会发生隐 喻。“雪”的形状像“花”,所以称为“雪花”;“脚”和“人”的关系近似于“页面底部”和“页面”的关系,所以 “页面底部”称为“页脚”;小脑中有一块连接左右两侧的组织,因为功能类似于“桥”的连接作用,因此称 为“脑桥”。在这些名名复合词中,都是中心语名词产生了隐喻义;并且,这种隐喻义也同样分别是在形 式角色、构成角色和功能角色的基础上形成的。 以生成词库视角来探讨汉语复合词构词语素之间的关系,这属于构词法领域的研究。这种研究有 别于我们传统上对于词语构造的一般性认识。过去的构词研究往往根据语素的数量将词语分为单纯词 和合成词,合成词进一步分为复合式合成词和派生式合成词,复合式里面再根据语素之间的语义语法关 系分为联合式、主谓式、述宾式等,派生式复合词再进一步研究词根和词缀之间的关系等。② 这种关于 词语的构造研究大体上还是基于形式或形态上的,对于词语中不同语素之间的关系,特别是语义关系, 关注得还不够,而生成词库视角下的研究则在一定程度上弥补了这个方面的不足。 此外,按照物性角色可以对词语中的语素加以标注,进而将语素之间的语义关系清晰地表示出来; 通过对词语大规模的语义信息标注,可以在此基础上抽象出一套语素组合的模板,最终实现机器对词语 的自动语义分析和剖析。同时,在汉语作为第二语言的词汇教学领域,利用物性角色对词语所做的标注 可以用来说明和解释词语的意义,以便汉语学习者能更为清晰和透彻地掌握词语的意义。这些都是传 统的词义分析方法难以解决或者不好解决的问题。 (二)语义组合与强迫 语言成分的语义组合性问题一直以来都是语义学研究的重要课题。从生成词库论的角度来研究词 语的语义之间是如何组合在一起的,这是一个颇为新颖的尝试。 Wang& Huang③ 结合名词物性角色、语义类型和组合机制分别对汉语中的动词和形容词与名词 的组合进行了考察。在动名组合中,他们以动词“看”为例,尽可能多地搜集了“看 NP”短语,然后根据 “看”的不同意义分为不同的情况,以不同的组合机制为条目依次对“看 NP”进行了细致的研究。在形 名组合中,他们分两种情况:(1)说明形容词“长”可以修饰许多不同类型的名词,并且具有潜在的多义 第1期 李 强: 国内生成词库理论研究的回顾与展望 ·59· ① ② ③ SongZuoyan&ZhaoQingqing.QualiaRelationsinMetaphoricalNoun-NounCompounds[R],Proceedingsofthe 6thInternationalConferenceonGenerativeApproachestotheLexicon,September24~25,Pisa,Italy,2013. 张斌.现代汉语描写语法[M].北京:商务印书馆,2010. Wang,Shan& HuangChu-Ren.AdjectivalModificationtoNounsinMandarinChinese:CaseStudieson“cháng+ noun”and“adjective+túshūguǎn”[R],ProceedingsofThe24thPacificAsiaConferenceonLanguage,Informationand Computation (PACLIC24).November4~7,Sendai,Japan.2010a;Wang,Shan & Huang Chu-Ren.Compositional OperationsofMandarinChinesePerceptionVerb“kàn”:AGenerativeLexiconApproach[R].Proceedingsofthe24thPacificAsiaConferenceonLanguage,InformationandComputation(PACLIC24).November4~7,Sendai,Japan,2010b