当前位置：和泉文库 > 电气与自动化 > 浏览文档

【自然语言处理与理解】一种结合词向量和图模型的特定领域实体消歧方法编辑部

文件格式：PDF，文件大小：1.46MB，售价：3.9元

文档详细内容（约10页）

第11卷第3期智能系统学报 Vol.11 No.3 2016年6月 CAAI Transactions on Intelligent Systems Jun.2016 D0I:10.11992/is.201603048 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20160513.0958.036.html 一种结合词向量和图模型的特定领域实体消歧方法汪沛，线岩团2，郭剑毅2，文永华12，陈玮2，王红斌2 (1.昆明理工大学信息工程与自动化学院，云南昆明650500：2.昆明理工大学智能信息处理重点实验室，云南昆明 650500) 摘要：针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例，首先选取维基百科离线数据库中的旅游分类下的页面内容构建领域知识库，然后用知识库中的文本和从各大旅游网站爬取到的旅游文本，通过词向量计算工具Wod2Vc构建词向量模型，结合人工标注的实体关系图谱，采用一种基于图的随机游走算法辅助计算相似度，使其能够较准确地计算旅游领域词与词之间的相似度。最后，提取待消歧实体的背景文本的若干关键词和知识库中候选实体文本的若干关键词，利用训练好的词向量模型结合图模型分别进行交叉相似度计算，把相似度均值最高的候选实体作为最终的目标实体。实验结果表明，这种新的相似度计算方法能够有效获取实体指称项与目标实体之间的相似度，从而能够较为准确地实现特定领域的实体消歧。关键词：实体消歧；实体链接：Word2Vec;图模型：随机游走：维基百科中图分类号：TP393文献标志码：A文章编号：1673-4785(2016)03-0366-09 中文引用格式：汪沛，线岩团，郭剑毅，等.一种结合词向量和图模型的特定领域实体消歧方法[J].智能系统学报，2016,11(3)： 366-375. 英文引用格式：WANG Pei,XIAN Yantuan,GUO Jianyi,etal.A novel method using word vector and graphical models for entity disambiguation in specific topic domains[J].CAAI transactions on intelligent systems,2016,11(3):366-375. A novel method using word vector and graphical models for entity disambiguation in specific topic domains WANG Pei',XIAN Yantuan'2,GUO Jianyi2,WEN Yonghua2,CHEN Wei'2,WANG Hongbin'2 (1.School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China; 2.Key Laboratory of Intelligent Information Processing,Kunming University of Science and Technology,Kunming 650500,China) Abstract:In this paper,a novel method based on word vector and graph models is proposed to deal with entity dis- ambiguation in specific topic domains.Take the tourism topic domain as an example.The method firstly chooses the web-pages of the tourism category in a Wikipedia offline database to build a knowledge base;then,the tool Word2Vec is used to build a word vector model with the texts in the knowledge base and texts taken from several tourism websites.Combined with a manual annotation graph,a random walk algorithm based on the graph is used to compute similarity to accurately calculate the similarity between words within the tourism domain.Next,the method extracts several keywords from the background text of the entity to be disambiguated and compares them with the keyword text in the knowledge base that describes the candidate entities.Finally,the method uses the trained Word2Vec model and graphical model to calculate the similarity between the keywords of name mention and the keywords of candidate entities.The method then chooses the candidate entities which have the maximum average similarity to the target entity.Experimental results show that this new method can effectively capture the similarity between name mention and a target entity;thus,it can accurately achieve entity disambiguation of a topic-specific domain. Keywords:entity disambiguation;entity linking;Word2Vec;Wikipedia;graphical model;random walking 收稿日期：2016-03-19.网络出版日期：2016-05-13. 实体链接是知识库构建的关键技术之一，其目基金项目：国家自然科学基金项目(61262041,61472168,61462054， 61562052):云南省自然科学基金重点项目(2013FA0B0). 的是将文本中已经获取到的命名实体链接到已有的通信作者：郭剑毅.E-mail:adc86@hotmail.com

第１１卷第３期智能系统学报Ｖｏｌ．１１ №．３２０１６年６月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＪｕｎ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０３０４８网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０５１３．０９５８．０３６．ｈｔｍｌ一种结合词向量和图模型的特定领域实体消歧方法汪沛１，线岩团１，２，郭剑毅１，２，文永华１，２，陈玮１，２，王红斌１，２（１．昆明理工大学信息工程与自动化学院，云南昆明６５０５００；２．昆明理工大学智能信息处理重点实验室，云南昆明６５０５００）摘要：针对特定领域提出了一种结合词向量和图模型的方法来实现实体消歧。以旅游领域为例，首先选取维基百科离线数据库中的旅游分类下的页面内容构建领域知识库，然后用知识库中的文本和从各大旅游网站爬取到的旅游文本，通过词向量计算工具Ｗｏｒｄ２Ｖｅｃ构建词向量模型，结合人工标注的实体关系图谱，采用一种基于图的随机游走算法辅助计算相似度，使其能够较准确地计算旅游领域词与词之间的相似度。最后，提取待消歧实体的背景文本的若干关键词和知识库中候选实体文本的若干关键词，利用训练好的词向量模型结合图模型分别进行交叉相似度计算，把相似度均值最高的候选实体作为最终的目标实体。实验结果表明，这种新的相似度计算方法能够有效获取实体指称项与目标实体之间的相似度，从而能够较为准确地实现特定领域的实体消歧。关键词：实体消歧；实体链接；Ｗｏｒｄ２Ｖｅｃ；图模型；随机游走；维基百科中图分类号：ＴＰ３９３文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０３⁃０３６６⁃０９中文引用格式：汪沛，线岩团，郭剑毅，等．一种结合词向量和图模型的特定领域实体消歧方法［Ｊ］．智能系统学报，２０１６，１１（３）：３６６⁃３７５．英文引用格式：ＷＡＮＧＰｅｉ，ＸＩＡＮＹａｎｔｕａｎ，ＧＵＯＪｉａｎｙｉ，ｅｔａｌ．Ａｎｏｖｅｌｍｅｔｈｏｄｕｓｉｎｇｗｏｒｄｖｅｃｔｏｒａｎｄｇｒａｐｈｉｃａｌｍｏｄｅｌｓｆｏｒｅｎｔｉｔｙｄｉｓａｍｂｉｇｕａｔｉｏｎｉｎｓｐｅｃｉｆｉｃｔｏｐｉｃｄｏｍａｉｎｓ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１６，１１（３）：３６６⁃３７５．ＡｎｏｖｅｌｍｅｔｈｏｄｕｓｉｎｇｗｏｒｄｖｅｃｔｏｒａｎｄｇｒａｐｈｉｃａｌｍｏｄｅｌｓｆｏｒｅｎｔｉｔｙｄｉｓａｍｂｉｇｕａｔｉｏｎｉｎｓｐｅｃｉｆｉｃｔｏｐｉｃｄｏｍａｉｎｓＷＡＮＧＰｅｉ１，ＸＩＡＮＹａｎｔｕａｎ１，２，ＧＵＯＪｉａｎｙｉ１，２，ＷＥＮＹｏｎｇｈｕａ１，２，ＣＨＥＮＷｅｉ１，２，ＷＡＮＧＨｏｎｇｂｉｎ１，２（１．ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｕｔｏｍａｔｉｏｎ，ＫｕｎｍｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｋｕｎｍｉｎｇ６５０５００，Ｃｈｉｎａ；２．ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＩｎｔｅｌｌｉｇｅｎｔＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇ，ＫｕｎｍｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，Ｋｕｎｍｉｎｇ６５０５００，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｉｎｔｈｉｓｐａｐｅｒ，ａｎｏｖｅｌｍｅｔｈｏｄｂａｓｅｄｏｎｗｏｒｄｖｅｃｔｏｒａｎｄｇｒａｐｈｍｏｄｅｌｓｉｓｐｒｏｐｏｓｅｄｔｏｄｅａｌｗｉｔｈｅｎｔｉｔｙｄｉｓ⁃ ａｍｂｉｇｕａｔｉｏｎｉｎｓｐｅｃｉｆｉｃｔｏｐｉｃｄｏｍａｉｎｓ．Ｔａｋｅｔｈｅｔｏｕｒｉｓｍｔｏｐｉｃｄｏｍａｉｎａｓａｎｅｘａｍｐｌｅ．Ｔｈｅｍｅｔｈｏｄｆｉｒｓｔｌｙｃｈｏｏｓｅｓｔｈｅｗｅｂ－ｐａｇｅｓｏｆｔｈｅｔｏｕｒｉｓｍｃａｔｅｇｏｒｙｉｎａＷｉｋｉｐｅｄｉａｏｆｆｌｉｎｅｄａｔａｂａｓｅｔｏｂｕｉｌｄａｋｎｏｗｌｅｄｇｅｂａｓｅ；ｔｈｅｎ，ｔｈｅｔｏｏｌＷｏｒｄ２Ｖｅｃｉｓｕｓｅｄｔｏｂｕｉｌｄａｗｏｒｄｖｅｃｔｏｒｍｏｄｅｌｗｉｔｈｔｈｅｔｅｘｔｓｉｎｔｈｅｋｎｏｗｌｅｄｇｅｂａｓｅａｎｄｔｅｘｔｓｔａｋｅｎｆｒｏｍｓｅｖｅｒａｌｔｏｕｒｉｓｍｗｅｂｓｉｔｅｓ．Ｃｏｍｂｉｎｅｄｗｉｔｈａｍａｎｕａｌａｎｎｏｔａｔｉｏｎｇｒａｐｈ，ａｒａｎｄｏｍｗａｌｋａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｔｈｅｇｒａｐｈｉｓｕｓｅｄｔｏｃｏｍｐｕｔｅｓｉｍｉｌａｒｉｔｙｔｏａｃｃｕｒａｔｅｌｙｃａｌｃｕｌａｔｅｔｈｅｓｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｗｏｒｄｓｗｉｔｈｉｎｔｈｅｔｏｕｒｉｓｍｄｏｍａｉｎ．Ｎｅｘｔ，ｔｈｅｍｅｔｈｏｄｅｘｔｒａｃｔｓｓｅｖｅｒａｌｋｅｙｗｏｒｄｓｆｒｏｍｔｈｅｂａｃｋｇｒｏｕｎｄｔｅｘｔｏｆｔｈｅｅｎｔｉｔｙｔｏｂｅｄｉｓａｍｂｉｇｕａｔｅｄａｎｄｃｏｍｐａｒｅｓｔｈｅｍｗｉｔｈｔｈｅｋｅｙｗｏｒｄｔｅｘｔｉｎｔｈｅｋｎｏｗｌｅｄｇｅｂａｓｅｔｈａｔｄｅｓｃｒｉｂｅｓｔｈｅｃａｎｄｉｄａｔｅｅｎｔｉｔｉｅｓ．Ｆｉｎａｌｌｙ，ｔｈｅｍｅｔｈｏｄｕｓｅｓｔｈｅｔｒａｉｎｅｄＷｏｒｄ２Ｖｅｃｍｏｄｅｌａｎｄｇｒａｐｈｉｃａｌｍｏｄｅｌｔｏｃａｌｃｕｌａｔｅｔｈｅｓｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｔｈｅｋｅｙｗｏｒｄｓｏｆｎａｍｅｍｅｎｔｉｏｎａｎｄｔｈｅｋｅｙｗｏｒｄｓｏｆｃａｎｄｉｄａｔｅｅｎｔｉｔｉｅｓ．Ｔｈｅｍｅｔｈｏｄｔｈｅｎｃｈｏｏｓｅｓｔｈｅｃａｎｄｉｄａｔｅｅｎｔｉｔｉｅｓｗｈｉｃｈｈａｖｅｔｈｅｍａｘｉｍｕｍａｖｅｒａｇｅｓｉｍｉｌａｒｉｔｙｔｏｔｈｅｔａｒｇｅｔｅｎｔｉｔｙ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｉｓｎｅｗｍｅｔｈｏｄｃａｎｅｆｆｅｃｔｉｖｅｌｙｃａｐｔｕｒｅｔｈｅｓｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｎａｍｅｍｅｎｔｉｏｎａｎｄａｔａｒｇｅｔｅｎｔｉｔｙ；ｔｈｕｓ，ｉｔｃａｎａｃｃｕｒａｔｅｌｙａｃｈｉｅｖｅｅｎｔｉｔｙｄｉｓａｍｂｉｇｕａｔｉｏｎｏｆａｔｏｐｉｃ－ｓｐｅｃｉｆｉｃｄｏｍａｉｎ．Ｋｅｙｗｏｒｄｓ：ｅｎｔｉｔｙｄｉｓａｍｂｉｇｕａｔｉｏｎ；ｅｎｔｉｔｙｌｉｎｋｉｎｇ；Ｗｏｒｄ２Ｖｅｃ；Ｗｉｋｉｐｅｄｉａ；ｇｒａｐｈｉｃａｌｍｏｄｅｌ；ｒａｎｄｏｍｗａｌｋｉｎｇ收稿日期：２０１６⁃０３⁃１９．网络出版日期：２０１６⁃０５⁃１３．基金项目：国家自然科学基金项目（６１２６２０４１，６１４７２１６８，６１４６２０５４，６１５６２０５２）；云南省自然科学基金重点项目（２０１３ＦＡ０３０）．通信作者：郭剑毅．Ｅ⁃ｍａｉｌ：ｇｊａｄｅ８６＠ｈｏｔｍａｉｌ．ｃｏｍ．实体链接是知识库构建的关键技术之一，其目的是将文本中已经获取到的命名实体链接到已有的

第3期汪沛，等：一种结合词向量和图模型的特定领域实体消歧方法 ·367· 知识库中，实体消岐是实体链接的关键任务。由于在上面的例子中，很明显第一句中的“香格里海量数据中存在的实体指称通常可以对应到多个命拉”指的是某旅游胜地，第二句指的是某著名酒店名实体概念，这无疑对实体消歧造成了很大的障碍。品牌，但是如何让计算机也能将实体指称项准确链实体消歧的任务就是将这些存在歧义的实体指称在接到知识库中具有特定概念的实体仍然是自然语言众多的候选实体中匹配出对应的目标实体。目前实处理领域研究的热点和难点。体消歧任务分为两种类型：实体聚类消歧和实体链传统的消歧模型难以有效利用能反映领域特有接消歧山，实体聚类消歧就是利用聚类算法来对实属性的实体词特征。因此，本文针对旅游领域实体体进行消歧，而实体链接消歧则是借助外部知识库，间的关系较为复杂的特征，提出了一种结合词向量将待消歧命名实体指称链接到外部知识库中对应实和图模型的消歧方法，通过提取实体指称项背景文体来进行消歧。本文选择用后者来实现特定领域的本的若干关键词和候选实体文本的若干关键词，利实体消歧。用训练好的模型对这些关键词分别进行交叉相似度实体消歧的本质是计算实体指称项和候选实体计算，把相似度均值最高的候选实体作为最终的目的相似度，选择相似度最大的候选实体作为链接的标实体。目标实体2】。针对英文实体消岐，Bunescu和Pas- 1 ca[)提出了一种基于余弦相似度排序的方法来实现相关理论实体消歧。Bagga和Gideon4s]等将实体指称项的 1.1词向量上下文与候选实体的上下文分别表示成BOW(Bag 在自然语言处理中，要将自然语言理解的问题 of words)向量形式，利用向量空间模型实现了人名转化为机器学习的问题，就需将自然语言的符号数的消歧。韩先培等)提出一种基于图的实体消歧学化，其中最直观和常用的方法是One-hot表示法。方法，将指称项与实体通过带权的无向图连接起来，这种方法将每个词表示为一个很长的向量，其维数从而将指称项与实体、实体与实体间的语义关联通是词汇表大小，其中绝大多数元素为0，只有一个维过图的形式表征出来。上述工作主要是对英文的实度的值为1，这个维度就代表当前的词。体消歧，相比较而言，针对中文的实体消歧工作远远在自然语言处理中，常将One-hot表示采用稀落后于英文。在中文的实体消歧领域，王建勇等] 疏的方式进行存储，即为每个词分配一个数字D。利用一种基于图的GHOST算法，结合AP聚类算法该方法因其简单易用，广泛应用于各种自然语言处进行相似度计算，在人名消歧方面取得了较好的实理任务中，如N-gram模型中就采用这种词向量表示验结果。怀宝兴等)提出了一种基于概率主题模法。但这种表述方法也存在一定问题：其表示的任型的命名实体链接方法，在通用领域，通过构建歧义意两个词之间是孤立的，无法表示这两个词之间的词表，用LDA基于语义层面对文档建模和实体消依赖关系，从词向量上看不出两个词是否相关：采用岐：宁博等9]针对中文命名实体消歧问题提出了一稀疏表示法，在处理某些任务，如构建N-gram模型种基于异构知识库的层次聚类方法，将维基百科和时，会引起维数灾难问题。百度百科结合起来作为多源知识库，并利用Hadoop 而在机器学习领域，一般采用分布式表示(ds 平台进行层次聚类，从而实现实体消歧。另外，朱敏 tributed representation)的方法表示词向量，这种表等[1]提出了一种实体聚类消歧与百度百科词频的示法最早由Hinton!)提出，通常称为Word Repre-- 同类实体消歧相结合的消歧方法，通过构建同义词 sentation。这种方法将词用一种低维实数向量表示，表、优化知识库、改进拼音距离编辑算法等方式实现优点在于相似的词在距离上更接近，能体现出不同对中文微博的实体消歧。词之间的相关性，从而反映词之间的依赖关系。同同样在旅游领域也存在着大量的实体同名现时，较低的维度也使特征向量在应用时有一个可接象，在维基百科中“金花”一词有11个同名实体，受的复杂度。因此，新近提出的许多语言模型，如潜 “香格里拉”一词有12个同名实体，这无疑对消歧在语义分析(latent semantic analysis,LSA)模型、潜工作产生很大影响，例如，给定两个句子：在狄利克雷分布(latent dirichlet allocation,LDA)模 1)2014年，香格里拉县共接待国内外游客型以及目前流行的神经网络模型等，都采用这种方 1080.22万人次。法表示词向量213) 2)在结束了一天的旅程后我们选择了在香格本文利用旅游领域的丰富语料对词向量模型进里拉酒店入住。行训练，从而将抽取的关键词进行向量化表示，用这

知识库中，实体消岐是实体链接的关键任务。由于海量数据中存在的实体指称通常可以对应到多个命名实体概念，这无疑对实体消歧造成了很大的障碍。实体消歧的任务就是将这些存在歧义的实体指称在众多的候选实体中匹配出对应的目标实体。目前实体消歧任务分为两种类型：实体聚类消歧和实体链接消歧［１］，实体聚类消歧就是利用聚类算法来对实体进行消歧，而实体链接消歧则是借助外部知识库，将待消歧命名实体指称链接到外部知识库中对应实体来进行消歧。本文选择用后者来实现特定领域的实体消歧。实体消歧的本质是计算实体指称项和候选实体的相似度，选择相似度最大的候选实体作为链接的目标实体［２］。针对英文实体消岐，Ｂｕｎｅｓｃｕ和Ｐａｓ⁃ ｃａ［３］提出了一种基于余弦相似度排序的方法来实现实体消歧。Ｂａｇｇａ和Ｇｉｄｅｏｎ［４⁃５］等将实体指称项的上下文与候选实体的上下文分别表示成ＢＯＷ（Ｂａｇｏｆｗｏｒｄｓ）向量形式，利用向量空间模型实现了人名的消歧。韩先培等［６］提出一种基于图的实体消歧方法，将指称项与实体通过带权的无向图连接起来，从而将指称项与实体、实体与实体间的语义关联通过图的形式表征出来。上述工作主要是对英文的实体消歧，相比较而言，针对中文的实体消歧工作远远落后于英文。在中文的实体消歧领域，王建勇等［７］利用一种基于图的ＧＨＯＳＴ算法，结合ＡＰ聚类算法进行相似度计算，在人名消歧方面取得了较好的实验结果。怀宝兴等［８］提出了一种基于概率主题模型的命名实体链接方法，在通用领域，通过构建歧义词表，用ＬＤＡ基于语义层面对文档建模和实体消岐；宁博等［９］针对中文命名实体消歧问题提出了一种基于异构知识库的层次聚类方法，将维基百科和百度百科结合起来作为多源知识库，并利用Ｈａｄｏｏｐ平台进行层次聚类，从而实现实体消歧。另外，朱敏等［１０］提出了一种实体聚类消歧与百度百科词频的同类实体消歧相结合的消歧方法，通过构建同义词表、优化知识库、改进拼音距离编辑算法等方式实现对中文微博的实体消歧。同样在旅游领域也存在着大量的实体同名现象，在维基百科中“金花” 一词有１１个同名实体， “香格里拉”一词有１２个同名实体，这无疑对消歧工作产生很大影响，例如，给定两个句子：１）２０１４年，香格里拉县共接待国内外游客１０８０．２２万人次。２）在结束了一天的旅程后我们选择了在香格里拉酒店入住。在上面的例子中，很明显第一句中的“香格里拉”指的是某旅游胜地，第二句指的是某著名酒店品牌，但是如何让计算机也能将实体指称项准确链接到知识库中具有特定概念的实体仍然是自然语言处理领域研究的热点和难点。传统的消歧模型难以有效利用能反映领域特有属性的实体词特征。因此，本文针对旅游领域实体间的关系较为复杂的特征，提出了一种结合词向量和图模型的消歧方法，通过提取实体指称项背景文本的若干关键词和候选实体文本的若干关键词，利用训练好的模型对这些关键词分别进行交叉相似度计算，把相似度均值最高的候选实体作为最终的目标实体。１相关理论１．１词向量在自然语言处理中，要将自然语言理解的问题转化为机器学习的问题，就需将自然语言的符号数学化，其中最直观和常用的方法是Ｏｎｅ⁃ｈｏｔ表示法。这种方法将每个词表示为一个很长的向量，其维数是词汇表大小，其中绝大多数元素为０，只有一个维度的值为１，这个维度就代表当前的词。在自然语言处理中，常将Ｏｎｅ⁃ｈｏｔ表示采用稀疏的方式进行存储，即为每个词分配一个数字ＩＤ。该方法因其简单易用，广泛应用于各种自然语言处理任务中，如Ｎ⁃ｇｒａｍ模型中就采用这种词向量表示法。但这种表述方法也存在一定问题：其表示的任意两个词之间是孤立的，无法表示这两个词之间的依赖关系，从词向量上看不出两个词是否相关；采用稀疏表示法，在处理某些任务，如构建Ｎ⁃ｇｒａｍ模型时，会引起维数灾难问题。而在机器学习领域，一般采用分布式表示（ｄｉｓ⁃ ｔｒｉｂｕｔｅｄｒｅｐｒｅｓｅｎｔａｔｉｏｎ）的方法表示词向量，这种表示法最早由Ｈｉｎｔｏｎ［１１］提出，通常称为ＷｏｒｄＲｅｐｒｅ⁃ ｓｅｎｔａｔｉｏｎ。这种方法将词用一种低维实数向量表示，优点在于相似的词在距离上更接近，能体现出不同词之间的相关性，从而反映词之间的依赖关系。同时，较低的维度也使特征向量在应用时有一个可接受的复杂度。因此，新近提出的许多语言模型，如潜在语义分析（ｌａｔｅｎｔｓｅｍａｎｔｉｃａｎａｌｙｓｉｓ，ＬＳＡ）模型、潜在狄利克雷分布（ｌａｔｅｎｔｄｉｒｉｃｈｌｅｔａｌｌｏｃａｔｉｏｎ，ＬＤＡ）模型以及目前流行的神经网络模型等，都采用这种方法表示词向量［１２⁃１３］。本文利用旅游领域的丰富语料对词向量模型进行训练，从而将抽取的关键词进行向量化表示，用这第３期汪沛，等：一种结合词向量和图模型的特定领域实体消歧方法 ·３６７·

·368 智能系统学报第11卷若干个关键词向量来表征一篇文档，通过计算关键则的变动形式，如同一个人酒后乱步，所形成的随机词向量间的余弦相似度得出它们之间的关联程度，过程记录6。它的基本思想是，从一个或一系列顶进而得出文档之间的相似度。点开始遍历一张图，在任意一个顶点，遍历者将以概 l.2 TextRank算法率1-α游走到这个顶点的邻居顶点，以概率α随机同一文档中的大多数词语都是为表达同一主题跳跃到图中的任何一个顶点，称α跳转发生概率，服务的，它们之间具有一定的语义关系。和词语W 每次游走后得出一个概率分布，该概率分布刻画了有语义关系的词语越多，词语W越可能是表达文档图中每一个顶点被访问到的概率，用这个概率分布主题的重要词语，同时和词语W有语义关系的词语作为下一次游走的输人并反复迭代这一过程，当满的重要性也会影响词语W的重要性。根据这两个足一定前提条件时，这个概率分布会趋于收敛，收敛特性，本节引入基于图的排序算法用于抽取多文档后，即可以得到一个稳定的概率分布。近年来，随机关键词。基于图的排序算法是决定图中点重要性的游走算法逐渐开始吸引机器学习研究者的目光，并一种方法，它根据全局信息（图的结构）而不是局部开始被应用于半监督学习.1】、聚类分析192】、图信息来对节点排序。其基本理论是“投票”，当图中像分割[]和图的匹配[]等问题上。与随机游走相一个点A和另一个点B之间有连线时，那么点A就关的扩散核也被应用于242)基于核的学习等方面。给点B投票，点B获得的投票越多，点B就越重要；由于实体间的关系错综复杂，可以将这种关系更进一步，投票点A的重要性决定了其投票的重要抽象为一种图模型，本文在这种图模型上运用随机性，因此，点B的分数由其获得的投票和给B投票的游走算法可以将实体间的关联程度准确地表征点的分数共同决定。出来。 Mihalcea14]将在自然语言处理领域中应用的 2领域实体消歧基于图的排序算法称为TextRank,一般TextRank模型可以表示为一个加权的有向图。TextRank的思想 2.1系统流程来源于Google的PageRank算法，通过把文本分割本文提出的方法由4个模块构成分别为关键词成若干组成单元并建立图模型，利用投票机制对文提取模块、词向量模块、图模型模块和空实体判断本中的重要成分进行排序，仅利用单篇文档本身的模块。信息即可实现关键词抽取。本文采用该算法将文档在关键词提取模块中，分别利用TextRank算法表示为无向图G(V,E),由点集合V和边集合E组提取出待消歧的实体指称所在的背景文本的若干关成，E是V×V的子集，图中两点i,j之间边的权重为键词和候选实体对应的知识库描述文本的若干关键 W。对于一个给定的点V:,n(V)为指向该点的点词，这里提取的两组关键词用于后面的相似度计算。集合，Out(V:)为点V指向的点集合，点V,的分数在词向量模块中，抽取维基百科离线数据中旅定义为式(2)：游分类下的页面信息构建领域知识库，由于维基百 Ws(V)=(1-d)+d×∑ 10 科中包含大量的结构化信息，取该知识库的摘要信 —WS(V) a(∑ 0声息作为语料对词向量模型进行训练，这时，领域实体 VeOu(V) 都能通过该模型表征为一个向量，从而实现关键词 (2) 之间的相似度计算。式中：d为阻尼因数，取值范围为0~1，代表从图中在图模型模块中，人工构建一个领域实体关系某一特定点指向其他任意点的概率。通过这种算法图谱，通过在该图谱上的随机游走算法实现关键词我们可以获得每个词语在文档中的分数，从而可以之间相似度的计算。根据分数大小来进行关键词的排序。在空实体判断模块中，从待消歧实体指称所在本文利用该算法抽取文档中的关键词，分别用的文本中抽取若干关键词和从候选实体所在文本中抽取的关键词来表征待消歧实体指称项所在文本和抽取的关键词分别用本文提出的图模型与词向量方目标实体所在文本。法相结合进行交叉相似度计算取平均值，选择其中 1.3随机游走算法最大的相似度平均值，因为计算结果所对应的目标随机游走模型是在1905年Karl Pearsonti]首实体未必在我们的知识库中存在，这时通过比对该次提出的一种数学统计模型，它是一连串的轨迹组平均值与通过大量实验确定的空实体阈值入的大成的，其中每一次都是随机的。它能用来表示不规小，如果大于该阈值入，则该实体为目标实体，如果

若干个关键词向量来表征一篇文档，通过计算关键词向量间的余弦相似度得出它们之间的关联程度，进而得出文档之间的相似度。１．２ＴｅｘｔＲａｎｋ算法同一文档中的大多数词语都是为表达同一主题服务的，它们之间具有一定的语义关系。和词语Ｗ有语义关系的词语越多，词语Ｗ越可能是表达文档主题的重要词语，同时和词语Ｗ有语义关系的词语的重要性也会影响词语Ｗ的重要性。根据这两个特性，本节引入基于图的排序算法用于抽取多文档关键词。基于图的排序算法是决定图中点重要性的一种方法，它根据全局信息（图的结构）而不是局部信息来对节点排序。其基本理论是“投票”，当图中一个点Ａ和另一个点Ｂ之间有连线时，那么点Ａ就给点Ｂ投票，点Ｂ获得的投票越多，点Ｂ就越重要；更进一步，投票点Ａ的重要性决定了其投票的重要性，因此，点Ｂ的分数由其获得的投票和给Ｂ投票的点的分数共同决定。Ｍｉｈａｌｃｅａ［１４］将在自然语言处理领域中应用的基于图的排序算法称为ＴｅｘｔＲａｎｋ，一般ＴｅｘｔＲａｎｋ模型可以表示为一个加权的有向图。ＴｅｘｔＲａｎｋ的思想来源于Ｇｏｏｇｌｅ的ＰａｇｅＲａｎｋ算法，通过把文本分割成若干组成单元并建立图模型，利用投票机制对文本中的重要成分进行排序，仅利用单篇文档本身的信息即可实现关键词抽取。本文采用该算法将文档表示为无向图Ｇ（Ｖ，Ｅ），由点集合Ｖ和边集合Ｅ组成，Ｅ是Ｖ×Ｖ的子集，图中两点ｉ，ｊ之间边的权重为Ｗｊ。对于一个给定的点Ｖｉ，Ｉｎ（Ｖｉ）为指向该点的点集合，Ｏｕｔ（Ｖｉ）为点Ｖｉ指向的点集合，点Ｖｉ的分数定义为式（２）：ＷＳ（Ｖｉ）＝（１－ｄ）＋ｄ × Ｖ ∑ ｊ∈Ｉｎ（Ｖｉ）ｗｊｉＶ ∑ｋ∈Ｏｕｔ（Ｖｉ）ｗｊｋＷＳ（Ｖｊ）（２）式中：ｄ为阻尼因数，取值范围为０～１，代表从图中某一特定点指向其他任意点的概率。通过这种算法我们可以获得每个词语在文档中的分数，从而可以根据分数大小来进行关键词的排序。本文利用该算法抽取文档中的关键词，分别用抽取的关键词来表征待消歧实体指称项所在文本和目标实体所在文本。１．３随机游走算法随机游走模型是在１９０５年ＫａｒｌＰｅａｒｓｏｎ［１５］首次提出的一种数学统计模型，它是一连串的轨迹组成的，其中每一次都是随机的。它能用来表示不规则的变动形式，如同一个人酒后乱步，所形成的随机过程记录［１６］。它的基本思想是，从一个或一系列顶点开始遍历一张图，在任意一个顶点，遍历者将以概率１－α 游走到这个顶点的邻居顶点，以概率 α 随机跳跃到图中的任何一个顶点，称 α 跳转发生概率，每次游走后得出一个概率分布，该概率分布刻画了图中每一个顶点被访问到的概率，用这个概率分布作为下一次游走的输入并反复迭代这一过程，当满足一定前提条件时，这个概率分布会趋于收敛，收敛后，即可以得到一个稳定的概率分布。近年来，随机游走算法逐渐开始吸引机器学习研究者的目光，并开始被应用于半监督学习［１７⁃１８］、聚类分析［１９⁃２１］、图像分割［２２］和图的匹配［２３］等问题上。与随机游走相关的扩散核也被应用于［２４⁃２８］基于核的学习等方面。由于实体间的关系错综复杂，可以将这种关系抽象为一种图模型，本文在这种图模型上运用随机游走算法可以将实体间的关联程度准确地表征出来。２领域实体消歧２．１系统流程本文提出的方法由４个模块构成分别为关键词提取模块、词向量模块、图模型模块和空实体判断模块。在关键词提取模块中，分别利用ＴｅｘｔＲａｎｋ算法提取出待消歧的实体指称所在的背景文本的若干关键词和候选实体对应的知识库描述文本的若干关键词，这里提取的两组关键词用于后面的相似度计算。在词向量模块中，抽取维基百科离线数据中旅游分类下的页面信息构建领域知识库，由于维基百科中包含大量的结构化信息，取该知识库的摘要信息作为语料对词向量模型进行训练，这时，领域实体都能通过该模型表征为一个向量，从而实现关键词之间的相似度计算。在图模型模块中，人工构建一个领域实体关系图谱，通过在该图谱上的随机游走算法实现关键词之间相似度的计算。在空实体判断模块中，从待消歧实体指称所在的文本中抽取若干关键词和从候选实体所在文本中抽取的关键词分别用本文提出的图模型与词向量方法相结合进行交叉相似度计算取平均值，选择其中最大的相似度平均值，因为计算结果所对应的目标实体未必在我们的知识库中存在，这时通过比对该平均值与通过大量实验确定的空实体阈值 λ 的大小，如果大于该阈值 λ，则该实体为目标实体，如果 ·３６８· 智能系统学报第１１卷

第3期汪沛，等：一种结合词向量和图模型的特定领域实体消歧方法 ·369- 小于入，则认为该实体指称在知识库中没有与之对点都获得一个分数，代表该点在图中的重要性，也就应的目标实体，即空实体。是该词语在文档中的重要性。表1为利用该算法确定的待消歧实体文本和对应的3个候选实体文本中 /实体指称确定候图模型选实体词向量的关键词，待消歧实体和候选实体1指的是香格里拉（景点名），候选实体2指的是香格里拉（酒店毽名)，候选实体3指的是香格里拉（城市名）。手工构建背景知识库百科表I用TextRank抽取的关键词的语料库文本最文本语料 Table 1 Keywords extracted by TextRank 待消歧实体候选实体1 候选实体2 候选实体3 人工构建提取若干关键词文本文本文本文本图模型基于图的随关键词交叉相似度 Word2Vee 得到词问量香格里拉香格里拉酒店藏族机游走模型计算取均值模型心中云南省香格里拉香格里拉 <是否大于岗值无指代实体出发民族亚洲民族 Y空实体判断寻找景点集团扎西取均值最大的作为目标实体位置旅游饭店传奇图1系统总体框架稻城香格里拉县商贸成长 Fig.1 Overall framework of system 2.3词向量的训练和应用 2.2关键词提取 Word2Vec是Google在2013年推出并开源的一关键词提取模块分为两个步骤：候选实体获取款将词表征为实数值向量的高效工具，其利用深度和关键词提取。候选实体获取实质上就是罗列出所学习的思想，可以通过训练把对文本内容的处理简有可能是待消歧的实体指称项的目标实体，由于中化为K维向量空间中的向量运算，而向量空间上的文语义的多样性，一个词通常有多种表达方式，同样相似度可以用来表示文本语义上的相似度。一个实体也可能有多种形式，例如，在维基百科的重 Word2Vec输出的词向量可以被用来做很多NLP相定向页面中，“驴友”与“背包客”指的是同一个实关的工作，比如聚类、找同义词、词性分析等。如果体，“虫草”与“冬虫夏草”指的也是同一实体。针对换个思路，把词当做特征，那么Word2Vec就可以把这种情况，利用维基百科离线数据库提供的3个特征映射到K维向量空间，可以为文本数据寻求更 SQL文件即可得到所有重定向的同义词，并且能得加深层次的特征表示，本文将K值选定为200维。到他们对应的页面信息和链接信息。本文主要利用该工具来实现指称项与目标实体关键词提取即在确定候选实体后，从待消歧实间的相似度计算，为了提高实验在旅游领域的准确体所在文本中抽取n个关键词，然后再从所有候选率，在选取训练语料时有针对性地选取旅游领域文实体在知识库中对应的文本中分别抽取n个关键本，这样就最大程度避免其他领域文本对词向量模词。这样做是因为本文中相似度计算的前提是假设型的精准度产生影响，本文一方面采用维基百科的待消歧背景文本与知识库中对应文本的主题一致，旅游分类下的文本来作为训练词向量模型的语料，在这个前提下，本文消歧任务实质已经转变为计算同时还加入了在各大旅游网站爬取的新闻语料。训待消歧实体指称所在背景文本与知识库中候选实体练完成后的模型能够比较准确地计算两个旅游领域对应文本之间的相似度。分别抽取两个文本各个词汇的相似度，效果比较理想。如表2所示为利用关键词，这里采用TextRank算法抽取权重最高的n 该工具计算出的背景文本中关键词“香格里拉”与个关键词，具体计算方法参照本文1.2节。根据词知识库中目标实体文本的7个关键词之间的相似与词之间在规定窗口大小内相互进行“投票”计算度，从图中可以发现其与“景点”、“旅游”等词语的出每个词在文档中的权重，在使用TextRank算法计相似度要明显高于“民族”、“比重”，这与现实世界算图中点的权重时，需要给图中的点指定任意的初中它们之间的语义关联程度相一致。通过词向量计值并递归计算直到某个词语分数收敛，收敛后每个算处理，进一步加强了实体词的领域相关性，有助于

小于 λ，则认为该实体指称在知识库中没有与之对应的目标实体，即空实体。图１系统总体框架Ｆｉｇ．１Ｏｖｅｒａｌｌｆｒａｍｅｗｏｒｋｏｆｓｙｓｔｅｍ２．２关键词提取关键词提取模块分为两个步骤：候选实体获取和关键词提取。候选实体获取实质上就是罗列出所有可能是待消歧的实体指称项的目标实体，由于中文语义的多样性，一个词通常有多种表达方式，同样一个实体也可能有多种形式，例如，在维基百科的重定向页面中，“驴友” 与“背包客” 指的是同一个实体，“虫草”与“冬虫夏草”指的也是同一实体。针对这种情况，利用维基百科离线数据库提供的３个ＳＱＬ文件即可得到所有重定向的同义词，并且能得到他们对应的页面信息和链接信息。关键词提取即在确定候选实体后，从待消歧实体所在文本中抽取ｎ个关键词，然后再从所有候选实体在知识库中对应的文本中分别抽取ｎ个关键词。这样做是因为本文中相似度计算的前提是假设待消歧背景文本与知识库中对应文本的主题一致，在这个前提下，本文消歧任务实质已经转变为计算待消歧实体指称所在背景文本与知识库中候选实体对应文本之间的相似度。分别抽取两个文本各ｎ个关键词，这里采用ＴｅｘｔＲａｎｋ算法抽取权重最高的ｎ个关键词，具体计算方法参照本文１．２节。根据词与词之间在规定窗口大小内相互进行“投票” 计算出每个词在文档中的权重，在使用ＴｅｘｔＲａｎｋ算法计算图中点的权重时，需要给图中的点指定任意的初值并递归计算直到某个词语分数收敛，收敛后每个点都获得一个分数，代表该点在图中的重要性，也就是该词语在文档中的重要性。表１为利用该算法确定的待消歧实体文本和对应的３个候选实体文本中的关键词，待消歧实体和候选实体１指的是香格里拉（景点名），候选实体２指的是香格里拉（酒店名），候选实体３指的是香格里拉（城市名）。表１用ＴｅｘｔＲａｎｋ抽取的关键词Ｔａｂｌｅ１ＫｅｙｗｏｒｄｓｅｘｔｒａｃｔｅｄｂｙＴｅｘｔＲａｎｋ待消歧实体文本候选实体１文本候选实体２文本候选实体３文本香格里拉香格里拉酒店藏族心中云南省香格里拉香格里拉出发民族亚洲民族寻找景点集团扎西位置旅游饭店传奇稻城香格里拉县商贸成长２．３词向量的训练和应用Ｗｏｒｄ２Ｖｅｃ是Ｇｏｏｇｌｅ在２０１３年推出并开源的一款将词表征为实数值向量的高效工具，其利用深度学习的思想，可以通过训练，把对文本内容的处理简化为Ｋ维向量空间中的向量运算，而向量空间上的相似度可以用来表示文本语义上的相似度。Ｗｏｒｄ２Ｖｅｃ输出的词向量可以被用来做很多ＮＬＰ相关的工作，比如聚类、找同义词、词性分析等。如果换个思路，把词当做特征，那么Ｗｏｒｄ２Ｖｅｃ就可以把特征映射到Ｋ维向量空间，可以为文本数据寻求更加深层次的特征表示，本文将Ｋ值选定为２００维。本文主要利用该工具来实现指称项与目标实体间的相似度计算，为了提高实验在旅游领域的准确率，在选取训练语料时有针对性地选取旅游领域文本，这样就最大程度避免其他领域文本对词向量模型的精准度产生影响，本文一方面采用维基百科的旅游分类下的文本来作为训练词向量模型的语料，同时还加入了在各大旅游网站爬取的新闻语料。训练完成后的模型能够比较准确地计算两个旅游领域词汇的相似度，效果比较理想。如表２所示为利用该工具计算出的背景文本中关键词“香格里拉” 与知识库中目标实体文本的７个关键词之间的相似度，从图中可以发现其与“景点”、“旅游”等词语的相似度要明显高于“民族”、“比重”，这与现实世界中它们之间的语义关联程度相一致。通过词向量计算处理，进一步加强了实体词的领域相关性，有助于第３期汪沛，等：一种结合词向量和图模型的特定领域实体消歧方法 ·３６９·

.370 智能系统学报第11卷后续环节的相似度计算。为了提高关键词之间相似度计算的准确率，我表2用词向量计算出的关键词之间相似度们在词向量的基础上加入了利用图模型计算的相似 Table 2 Similarity between keywords calculated by Word2Vec 度来综合衡量关键词之间的相似度，下面将重点介关键词1 关键词2 相似度绍一种用来计算相似度的基于图的随机游走算法。香格里拉香格里拉 1.0 由于目前我们已经人工手动搭建了一个领域实香格里拉云南省 0.25331938 体关系库，图2所示的就是一个典型的云南旅游领香格里拉民族 0.117823526 域相关实体的部分关系图谱，从图中我们认为“大香格里拉景点 0.4967134 理古城”与“大理市”之间的相似度要高于“乳扇”与香格里拉旅游 0.42981964 “大理市”之间的相似度，因为前两者之间是“位于” 香格里拉香格里拉县的关系直接相连，而后两者之间是通过“大理古城” 0.49656978 香格里拉比重这个中间实体相联系起来的，所以相比较而言，“乳 0.009633713 扇”与“大理市”之间的联系就要弱得多，同样，“特 2.4图模型的构建和应用产”与“大理古城”之间的相似度要比“旅游景点”与维基百科是目前世界上最大的在线百科全书， “大理古城”之间的相似度要弱得多，因为后者之间其内容每天都会由世界各地的志愿者进行编辑和更的路径更多，这些都与现实中实体之间的联系密切新，有着很好的时效性，另外，维基百科的页面包含程度相一致，而基于图的随机游走算法能将这种实有类别信息、重定向信息、外部链接信息等，这些信体之间的联系定量地表示出来。息无形中为实体之间建立了语义上的关联，所以本景点文选择维基百科作为实体消歧的知识库。由于本文是针对特定领域，本文抽取“旅游”分类信息下的所有页面作为最终的知识库来源，这样我们在很大程度上实现了消歧，例如，“香格里拉（科幻小说）”和 “香格里拉（电视剧）”就自然不在知识库中，也就在古城大理古城一定程度上缩小了候选实体的范围。在此基础上， 1 我们搭建了一个领域实体关系标注平台，利用图数据库No4j存储数据，这种图数据库与传统的关系 (a)从起始点出发型数据库相比能够更准确有效地表示各个数据项之间的复杂关系，将从维基百科中抽取到的领域实体导入该平台的图数据库，通过人工标注的方式构建了一个实体与实体之间的关系图谱，目的是通过利用在该图谱上的随机游走算法辅助计算关键词之间的相似度，目前该平台已经拥有13956个实体，8 127对关系。图2是部分实体及其之间的关系。大理古城位于美食 (b)到达第2个顶点后选择下一个目标 2 个大理市乳扇大研古城古城特产别名是类丽江古城旅游景点图2部分实体关系图谱 Fig.2 Part of the entity relationship mapping (c)到达第3个顶点后有两个选择

后续环节的相似度计算。表２用词向量计算出的关键词之间相似度Ｔａｂｌｅ２ＳｉｍｉｌａｒｉｔｙｂｅｔｗｅｅｎｋｅｙｗｏｒｄｓｃａｌｃｕｌａｔｅｄｂｙＷｏｒｄ２Ｖｅｃ关键词１关键词２相似度香格里拉香格里拉１．０香格里拉云南省０．２５３３１９３８香格里拉民族０．１１７８２３５２６香格里拉景点０．４９６７１３４香格里拉旅游０．４２９８１９６４香格里拉香格里拉县０．４９６５６９７８香格里拉比重０．００９６３３７１３２．４图模型的构建和应用维基百科是目前世界上最大的在线百科全书，其内容每天都会由世界各地的志愿者进行编辑和更新，有着很好的时效性，另外，维基百科的页面包含有类别信息、重定向信息、外部链接信息等，这些信息无形中为实体之间建立了语义上的关联，所以本文选择维基百科作为实体消歧的知识库。由于本文是针对特定领域，本文抽取“旅游”分类信息下的所有页面作为最终的知识库来源，这样我们在很大程度上实现了消歧，例如，“香格里拉（科幻小说）”和 “香格里拉（电视剧）”就自然不在知识库中，也就在一定程度上缩小了候选实体的范围。在此基础上，我们搭建了一个领域实体关系标注平台，利用图数据库Ｎｅｏ４ｊ存储数据，这种图数据库与传统的关系型数据库相比能够更准确有效地表示各个数据项之间的复杂关系，将从维基百科中抽取到的领域实体导入该平台的图数据库，通过人工标注的方式构建了一个实体与实体之间的关系图谱，目的是通过利用在该图谱上的随机游走算法辅助计算关键词之间的相似度，目前该平台已经拥有１３９５６个实体，８１２７对关系。图２是部分实体及其之间的关系。图２部分实体关系图谱Ｆｉｇ．２Ｐａｒｔｏｆｔｈｅｅｎｔｉｔｙｒｅｌａｔｉｏｎｓｈｉｐｍａｐｐｉｎｇ为了提高关键词之间相似度计算的准确率，我们在词向量的基础上加入了利用图模型计算的相似度来综合衡量关键词之间的相似度，下面将重点介绍一种用来计算相似度的基于图的随机游走算法。由于目前我们已经人工手动搭建了一个领域实体关系库，图２所示的就是一个典型的云南旅游领域相关实体的部分关系图谱，从图中我们认为“大理古城”与“大理市”之间的相似度要高于“乳扇”与 “大理市”之间的相似度，因为前两者之间是“位于” 的关系直接相连，而后两者之间是通过“大理古城” 这个中间实体相联系起来的，所以相比较而言，“乳扇”与“大理市”之间的联系就要弱得多，同样，“特产”与“大理古城”之间的相似度要比“旅游景点”与 “大理古城”之间的相似度要弱得多，因为后者之间的路径更多，这些都与现实中实体之间的联系密切程度相一致，而基于图的随机游走算法能将这种实体之间的联系定量地表示出来。（ａ）从起始点出发（ｂ）到达第２个顶点后选择下一个目标（ｃ）到达第３个顶点后有两个选择 ·３７０· 智能系统学报第１１卷

点击进入文档下载页（PDF格式）

共10页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录