当前位置：和泉文库 > 工程 > 浏览文档

基于关联关系的仿真模型实时智能推荐方法

当全球导航卫星系统(global navigation satellite system,GNSS)分布式仿真环境中共享的模型数量非常多时,检索模型和配置仿真任务将成为一个比较复杂的工程.为提高仿真模型选取和仿真任务配置的效率,设计了一套针对GNSS分布式仿真环境中仿真模型的实时智能推荐方法,方法中首先定义了模型关联关系和接口形状的概念,然后提出了一种条件约束下的频繁模式树(FP-tree)结构,并从理论上分析了该结构在检索任务量方面的减少程度,设计并推导了模型关联关系度的计算方法,以及整套智能推荐方法的运行流程.推荐方法在GNSS分布式仿真环境中进行了仿真验证,仿真结果与传统智能推荐方法做对比分析,分析结果表明,该方法针对仿真模型推荐时运行时间短,推荐结果准确度高,能够实时为用户推荐合适的模型.

文件格式：PDF，文件大小：524.76KB，售价：2.88元

文档详细内容（约8页）

工程科学学报，第39卷，第4期：626633,2017年4月 Chinese Journal of Engineering,Vol.39,No.4:626-633,April 2017 D0:10.13374/j.issn2095-9389.2017.04.019:htp:/journals.ustb.edu.cm 基于关联关系的仿真模型实时智能推荐方法范国超”，许承东)区，胡春生)，宋丹” 1)北京理工大学字航学院，北京1000812)宁夏大学机械工程学院，银川750021 ☒通信作者，E-mail:xucd@bit.edu.cn 摘要当全球导航卫星系统(global navigation satellite system,GNSs)分布式仿真环境中共享的模型数量非常多时，检索模型和配置仿真任务将成为一个比较复杂的工程.为提高仿真模型选取和仿真任务配置的效率，设计了一套针对GNSS分布式仿真环境中仿真模型的实时智能推荐方法，方法中首先定义了模型关联关系和接口形状的概念，然后提出了一种条件约束下的频繁模式树(FPe)结构，并从理论上分析了该结构在检索任务量方面的减少程度，设计并推导了模型关联关系度的计算方法，以及整套智能推荐方法的运行流程.推荐方法在GNS$分布式仿真环境中进行了仿真验证，仿真结果与传统智能推荐方法做对比分析，分析结果表明，该方法针对仿真模型推荐时运行时间短，推荐结果准确度高，能够实时为用户推荐合适的模型. 关键词全球导航卫星系统：分布式仿真：智能推荐：关联关系分类号TP391.9 Real-time intelligent recommendation method of a simulation model based on incidence relation FAN Guo-chao,XU Cheng-dong,HU Chun-sheng?,SONG Dan School of Aerospace Engineering,Beijing Institute of Technology,Beijing 100081,China School of Mechanical Engineering,Ningxia University.Yinchuan 750021,China Corresponding author,E-mail:xucd@bit.edu.cn ABSTRACT With the availability of a large number of sharing models,model search and task design would be an extremely complex project in the global navigation satellite system (GNSS)-distributed simulation environment(GDSE).For improving the efficiency of model search and task design,a real-time intelligent recommendation method was designed for GDSE.Based on the characteristics of the simulation model,the incidence relation and interface shape of the model were defined in the method and a conditional frequent pattern tree (FP-tree)structure was designed to further improve the retrieval efficiency.The effect of the conditional FP-tree structure was proved theoretically.Then,the calculation method of the model incidence relation degree was proposed and derived based on the Bayesian statistical method.The entire processing of the intelligent recommendation method was designed for implementing it in GDSE.Hence,to check the effect of the real-time intelligent recommendation method,it was implemented in GDSE.Compared with the simulation result of the traditional recommendation method,the model intelligent recommendation method is proved to have a shor- ter running time and a high accuracy on simulation model recommendation.The computing capability and real-time performance are proved through the simulation.It is demonstrated that the intelligent recommendation method is efficient and flexible for GDSE. KEY WORDS global navigation satellite system:distributed simulation:intelligent recommendation:incidence relation 全球导航卫星系统(global navigation satellite sys- tem,GNSS)分布式仿真环境(GNSS distributed simula-- 收稿日期：2016-06-23 基金项目：国家自然科学基金资助项目(61502257,41304031)

工程科学学报，第 39 卷，第 4 期: 626--633，2017 年 4 月 Chinese Journal of Engineering，Vol． 39，No． 4: 626--633，April 2017 DOI: 10． 13374 /j． issn2095--9389． 2017． 04． 019; http: / /journals． ustb． edu． cn 基于关联关系的仿真模型实时智能推荐方法范国超1) ，许承东1) ，胡春生2) ，宋丹1) 1) 北京理工大学宇航学院，北京 100081 2) 宁夏大学机械工程学院，银川 750021  通信作者，E-mail: xucd@ bit． edu． cn 摘要当全球导航卫星系统( global navigation satellite system，GNSS) 分布式仿真环境中共享的模型数量非常多时，检索模型和配置仿真任务将成为一个比较复杂的工程．为提高仿真模型选取和仿真任务配置的效率，设计了一套针对 GNSS 分布式仿真环境中仿真模型的实时智能推荐方法，方法中首先定义了模型关联关系和接口形状的概念，然后提出了一种条件约束下的频繁模式树( FP-tree) 结构，并从理论上分析了该结构在检索任务量方面的减少程度，设计并推导了模型关联关系度的计算方法，以及整套智能推荐方法的运行流程．推荐方法在 GNSS 分布式仿真环境中进行了仿真验证，仿真结果与传统智能推荐方法做对比分析，分析结果表明，该方法针对仿真模型推荐时运行时间短，推荐结果准确度高，能够实时为用户推荐合适的模型．关键词全球导航卫星系统; 分布式仿真; 智能推荐; 关联关系分类号 TP391. 9 收稿日期: 2016--06--23 基金项目: 国家自然科学基金资助项目( 61502257，41304031) Ｒeal-time intelligent recommendation method of a simulation model based on incidence relation FAN Guo-chao1) ，XU Cheng-dong1)  ，HU Chun-sheng2) ，SONG Dan1) School of Aerospace Engineering，Beijing Institute of Technology，Beijing 100081，China School of Mechanical Engineering，Ningxia University，Yinchuan 750021，China Corresponding author，E-mail: xucd@ bit． edu． cn ABSTＲACT With the availability of a large number of sharing models，model search and task design would be an extremely complex project in the global navigation satellite system ( GNSS) -distributed simulation environment ( GDSE) ． For improving the efficiency of model search and task design，a real-time intelligent recommendation method was designed for GDSE． Based on the characteristics of the simulation model，the incidence relation and interface shape of the model were defined in the method and a conditional frequent pattern tree ( FP-tree) structure was designed to further improve the retrieval efficiency． The effect of the conditional FP-tree structure was proved theoretically． Then，the calculation method of the model incidence relation degree was proposed and derived based on the Bayesian statistical method． The entire processing of the intelligent recommendation method was designed for implementing it in GDSE． Hence，to check the effect of the real-time intelligent recommendation method，it was implemented in GDSE． Compared with the simulation result of the traditional recommendation method，the model intelligent recommendation method is proved to have a shorter running time and a high accuracy on simulation model recommendation． The computing capability and real-time performance are proved through the simulation． It is demonstrated that the intelligent recommendation method is efficient and flexible for GDSE． KEY WOＲDS global navigation satellite system; distributed simulation; intelligent recommendation; incidence relation 全球导航卫星系统( global navigation satellite sys- tem，GNSS) 分布式仿真环境( GNSS distributed simula-

范国超等：基于关联关系的仿真模型实时智能推荐方法 ·627 tion environment,GDSE)是最近被提出来的一种GNSS 本文从服务化模型基本性质出发，提出了模型关仿真环境.该环境在面向互联网的前提下，结合了广联关系和接口形状的概念，定义并推导了衡量模型关义云计算(cloud computing,CC)核心理念一“对计联关系的指标，在关联规则的研究基础上提出了一种算资源进行共享”n-可和面向服务架构(service oriented 针对GNSS分布式仿真环境中仿真模型的智能推荐方 architecture,SOA)技术s-o,实现了多开发人员或用法，方法中首先在贝叶斯分析方法的基础上提出了模户发布并共用仿真模型或资源，达到研究新算法、新设型关联关系度的计算方法，然后设计了一种条件约束备和扩展新领域的目的.李伯虎等1在研究中验证下FP-ree数据存储结构以及推荐方法工作流程，并从了结合云计算的仿真环境可以有效地组织数据资源、理论上推理并讨论了该方法中部分工作的任务量等指模型资源、计算资源和存储资源，进而加速计算过程，标.最后利用200000组虚拟仿真任务记录数据对方实现资源共享、资源管理、资源配置、并行计算、协同工法进行仿真验证，对模型智能推荐方法的各项性能进作、信息服务和容错迁移.该仿真平台具有高度的共行测试，并与基于关联规则的数据挖掘方法进行对比享和重用能力，能够减少重复开发和投资，具备更高的分析.分析结果表明该方法在针对仿真模型推荐时运仿真能力.胡春生等在结合云计算的分布式仿真行时间短，推荐结果准确度高，具有很好的实施效果环境研究中提出了一种服务化分布式仿真环境的基本 1 模型关联关系和接口形状构架和实施方法，初步分析了模型管理的相关问题和研究思路，但并没有完全达到智能化管理的目的.随不同仿真环境中，仿真模型和仿真任务流程的概着服务化仿真平台的发展和应用，仿真模型数目会以念差别很大，因此在定义模型关联关系和接口形状之指数形式增大，并且应用场景和仿真需求不同，需要构前，首先明确了这两个概念。模型关联关系和接口形造的仿真流程的差异也较大，如何在大规模数量的模状是本文提出的两个概念，仿真平台以模型关联关系型中迅速找到合适仿真模型是一个十分重要的问题. 和接口形状为基础对仿真模型智能化管理，有助于仿利用计算机推理自动检索并推送给用户恰当的模型可真模型智能推荐方法的实现和推荐方法效率的提高以避免用户多次手动检索模型 1.1仿真模型日前针对计算机智能推荐方法主要基于数据挖掘大型仿真系统（包括数学仿真、半物理仿真等）是技术设计的，包括决策树、聚类、回归启发式方法、神经对系统级结构或平台的功能和性能上的模拟实现.由网络/关联规则挖掘等叨，这些方法在大规模数据挖于整体的数学或结构上的仿真很难直接实现，通常将掘和分析中具有很好的效果，并且多数方法已经应用其分解为若干个既相对独立又相互联系的子系统（包到了推荐系统上，但这些方法针对的推荐系统主要应含一个或多个功能单元)，这种子系统更方便使用数用领域为图书、文档、电影、商品等-0，被推荐对象学模型或物理模型表示出来，被用于表示的模型即为为完全独立的个体，互相基本没有相关关系.GNSS分仿真模型.不同系统的仿真可能包含相同功能的子系布式仿真环境中模型之间具有紧密的联系，这种联系统，即可使用相同的模型参与仿真使得模型的推荐工作与传统推荐方法有着巨大的差在GNSS分布式仿真环境中，利用上述思想，用户别.仿真任务中通常为10个以上模型的集合，使用传将能够实现部分功能的仿真模型依据接口规则共享到统数据挖掘方法在仿真任务的大规模数据记录中提取平台上.在有仿真需求时，根据需求用户可以挑选共信息两模型间关联关系时准确度会明显降低。仿真模享的模型组合形成能够实现特定系统功能的仿真型智能推荐方法的数据检索和挖掘的过程与传统的模任务. 式也有很大的区别，传统大数据挖掘过程通常是根据 1.2仿真任务流程一定的支持度或置信度阈值检索出相应的集合得到其用户在利用GNSS分布式仿真环境构建仿真任务中元素的关联关系，而模型的智能推荐工作中将先形时，需要调用仿真模型，配置模型之间的输入与输出关成候选模型，再依据候选模型检索得到统计结果并排系，配置完成后形成了一组具有关联关系的模型集合，序.另外仿真平台中的模型还具有多种特性：模型之这个包含配置信息和模型关联关系的模型集合即为仿间的连接和模型本身性质具有紧密的联系：同一研究真任务流程，用户可以直接运行仿真任务流程进行相领域的用户设计仿真任务会受到学科内容约束，在选应的仿真任务，获得最终想要的结果择仿真模型时具有一定的相似性：在不同应用场景和 1.3模型关联关系需求下，仿真任务设计所需的模型具有一定的差异性：在GNSS分布式仿真环境中，数学方法、硬件设备智能推荐方法需要在用户配置任务时及时为用户提供等资源均可虚拟化为仿真模型，并经过一定形式的封参考模型.上述性质对模型的智能推荐提出了一些新装后形成服务化模型.这种服务化模型是完全独立的的需求，如实时性、智能性、可配置性等. 个体，能够完成一定的特定功能，并通过统一标准的接

范国超等: 基于关联关系的仿真模型实时智能推荐方法 tion environment，GDSE) 是最近被提出来的一种 GNSS 仿真环境．该环境在面向互联网的前提下，结合了广义云计算( cloud computing，CC) 核心理念———“对计算资源进行共享”［1--7］和面向服务架构( service oriented architecture，SOA) 技术［8--10］，实现了多开发人员或用户发布并共用仿真模型或资源，达到研究新算法、新设备和扩展新领域的目的．李伯虎等［11--13］在研究中验证了结合云计算的仿真环境可以有效地组织数据资源、模型资源、计算资源和存储资源，进而加速计算过程，实现资源共享、资源管理、资源配置、并行计算、协同工作、信息服务和容错迁移．该仿真平台具有高度的共享和重用能力，能够减少重复开发和投资，具备更高的仿真能力．胡春生等［14--16］在结合云计算的分布式仿真环境研究中提出了一种服务化分布式仿真环境的基本构架和实施方法，初步分析了模型管理的相关问题和研究思路，但并没有完全达到智能化管理的目的．随着服务化仿真平台的发展和应用，仿真模型数目会以指数形式增大，并且应用场景和仿真需求不同，需要构造的仿真流程的差异也较大，如何在大规模数量的模型中迅速找到合适仿真模型是一个十分重要的问题．利用计算机推理自动检索并推送给用户恰当的模型可以避免用户多次手动检索模型．目前针对计算机智能推荐方法主要基于数据挖掘技术设计的，包括决策树、聚类、回归启发式方法、神经网络/关联规则挖掘等［17］，这些方法在大规模数据挖掘和分析中具有很好的效果，并且多数方法已经应用到了推荐系统上，但这些方法针对的推荐系统主要应用领域为图书、文档、电影、商品等［17--20］，被推荐对象为完全独立的个体，互相基本没有相关关系． GNSS 分布式仿真环境中模型之间具有紧密的联系，这种联系使得模型的推荐工作与传统推荐方法有着巨大的差别．仿真任务中通常为 10 个以上模型的集合，使用传统数据挖掘方法在仿真任务的大规模数据记录中提取信息两模型间关联关系时准确度会明显降低．仿真模型智能推荐方法的数据检索和挖掘的过程与传统的模式也有很大的区别，传统大数据挖掘过程通常是根据一定的支持度或置信度阈值检索出相应的集合得到其中元素的关联关系，而模型的智能推荐工作中将先形成候选模型，再依据候选模型检索得到统计结果并排序．另外仿真平台中的模型还具有多种特性: 模型之间的连接和模型本身性质具有紧密的联系; 同一研究领域的用户设计仿真任务会受到学科内容约束，在选择仿真模型时具有一定的相似性; 在不同应用场景和需求下，仿真任务设计所需的模型具有一定的差异性; 智能推荐方法需要在用户配置任务时及时为用户提供参考模型．上述性质对模型的智能推荐提出了一些新的需求，如实时性、智能性、可配置性等．本文从服务化模型基本性质出发，提出了模型关联关系和接口形状的概念，定义并推导了衡量模型关联关系的指标，在关联规则的研究基础上提出了一种针对 GNSS 分布式仿真环境中仿真模型的智能推荐方法，方法中首先在贝叶斯分析方法的基础上提出了模型关联关系度的计算方法，然后设计了一种条件约束下 FP-tree 数据存储结构以及推荐方法工作流程，并从理论上推理并讨论了该方法中部分工作的任务量等指标．最后利用 200000 组虚拟仿真任务记录数据对方法进行仿真验证，对模型智能推荐方法的各项性能进行测试，并与基于关联规则的数据挖掘方法进行对比分析．分析结果表明该方法在针对仿真模型推荐时运行时间短，推荐结果准确度高，具有很好的实施效果． 1 模型关联关系和接口形状不同仿真环境中，仿真模型和仿真任务流程的概念差别很大，因此在定义模型关联关系和接口形状之前，首先明确了这两个概念．模型关联关系和接口形状是本文提出的两个概念，仿真平台以模型关联关系和接口形状为基础对仿真模型智能化管理，有助于仿真模型智能推荐方法的实现和推荐方法效率的提高． 1. 1 仿真模型大型仿真系统( 包括数学仿真、半物理仿真等) 是对系统级结构或平台的功能和性能上的模拟实现．由于整体的数学或结构上的仿真很难直接实现，通常将其分解为若干个既相对独立又相互联系的子系统( 包含一个或多个功能单元) ，这种子系统更方便使用数学模型或物理模型表示出来，被用于表示的模型即为仿真模型．不同系统的仿真可能包含相同功能的子系统，即可使用相同的模型参与仿真．在 GNSS 分布式仿真环境中，利用上述思想，用户将能够实现部分功能的仿真模型依据接口规则共享到平台上．在有仿真需求时，根据需求用户可以挑选共享的模型组合形成能够实现特定系统功能的仿真任务． 1. 2 仿真任务流程用户在利用 GNSS 分布式仿真环境构建仿真任务时，需要调用仿真模型，配置模型之间的输入与输出关系，配置完成后形成了一组具有关联关系的模型集合，这个包含配置信息和模型关联关系的模型集合即为仿真任务流程，用户可以直接运行仿真任务流程进行相应的仿真任务，获得最终想要的结果． 1. 3 模型关联关系在 GNSS 分布式仿真环境中，数学方法、硬件设备等资源均可虚拟化为仿真模型，并经过一定形式的封装后形成服务化模型．这种服务化模型是完全独立的个体，能够完成一定的特定功能，并通过统一标准的接 · 726 ·

·628 工程科学学报，第39卷，第4期口协议配置输入输出信息与其他仿真模型建立联系 3R(Ma,M.)-0ut(M)nIn(M)≠⑦.(5) 在多个仿真模型组合形成仿真任务时，仿真模型间需式中，Out(A)表示M,的输出接口形状的集合，In(B) 要建立一种特殊的关系来确定模型之间资源的传递表示M。的输入接口形状的集合，若二者存在上述关 (如数学仿真模型的输入输出参数信息等)，这种关系系，则可以建立由M到M。的连接关系. 即为仿真模型关联关系接口形状池是指所有接口形状的集合，任意仿真通过构建仿真任务，本文发现能够与同一仿真模模型的输入和输出的接口均为接口形状池的子集，如型建立关系的几个模型构成的关系在一定程度上不是图1.将接口形状统计在一个集合下，便于对模型进行等价的，即他们与同一模型的亲疏程度有所不同，这种检索，给出具有相同接口形状的模型，建立模型间的关亲疏程度表现出了用户在建立仿真任务时的习惯偏联关系.因此，基于接口形状的检索可初步形成候选好.本文将这种模型之间的亲疏程度定义为模型关联模型集合，记为接口形状池，这样将为挑选候选模型减关系度，将模型关联关系度进行量化分析，可以得到不少大量的检索工作，加快检索速度同模型之间的亲疏程度排序 IN OUT 确定模型关联关系度主要有两种因素，即用户操作信息和模型接口形状，故模型关联关系度可以定接口形义为状池 d(Ma,Ma）=f(Ma,Nere）. (1) ■ 其中，M,、M.为两个建立关联关系的仿真模型，M 为有关用户的信息统计函数，主要由用户已选模型、仿真任务记录、模型库等信息处理得到；八为基于模图1 接口形状及接口形状池型接口形状进行处理所得到的结果.由于模型关联关 Fig.1 Interface shape and its pool 系具有方向性，因此 2 智能推荐方法设计 d(M、,M.)≠d(M,M,). (2) 关联关系度是一个对不同模型关联关系亲疏程度仿真模型智能推荐方法结合用户使用模型的基本的量化指标.因此与同一个模型建立关系的关联关系规律和模型的接口形状，根据当前用户所选择模型，智度为一个动态值，且存在归一化性质，即能推算下一个可能用到的模型，为用户设计仿真任务 ∑d(M,M,)=1. (3) 提供参考.该方法主要依靠模型本身的基本属性和统其中，M为任意可以与M、建立由M、到M的连接关计学方法，快速求取模型关联关系度并以此排序.同系的模型.由上述性质可知，模型关联关系度是在一时在数据挖掘过程中需要将相关方法依据仿真模型特定条件下的概率问题的求解，且其概率密度符合后验性重新设计. 分布，相应的求解方法可以贝叶斯统计为基础设计，即图2是仿真任务智能推荐模块在GNSS分布式仿 d(M)f()M)(M) 真环境中的基本架构，该模块根据语义管理库中的接 (4) 口形状池、模型库、仿真任务记录池以及人机交互界面 ∑f(g(M,M)1M,)m(M,) 中用户当前选择的部分模型进行检索和推理，最终给其中，g(M,M)为M,的样本信息，f(g(M,M)IM) 出一组经过排序的用户可能即将需要用到的模型集为M:发生的概率密度函数，m为候选模型个数合.图中可以看出，基于接口形状池的初步检索形成 1.4接口形状了候选模型集合，在依据模型关联关系度的计算和排仿真模型在封装后以统一的接口对外表现，主要序，对候选模型进行二次筛选和排序，最终确定了被推包括输入接口、输出接口和初始化接口三类，其中输入荐模型的有序集合接口和输出接口是用于在模型之间建立关系的，但不 2.1模型关联关系度计算方法是任意模型之间都能够建立起模型关系，通常对于数模型关联关系度主要根据以往配置信息记录，结学模型来讲，只有输入输出之间存在相同的量纲关系合权重的配置进行计算和比较分析.由公式(1)可时才能够建立连接关系. 知，关联关系度需结合用户信息和接口形状两个方面由于仿真模型可能包含多个输入或输出，所以本进行求解文规定，任意一个输入或输出均为一个模型接口，每个 (1)用户信息部分求解模型接口根据量纲和资源属性确定其接口形状.在不用户信息部分主要包括对模型库、用户当前操作同模型之间，只有含有相同形状的输入接口和输出接内容、仿真任务记录等相关信息的统计计算.在统计口两个模型才能建立关联关系，即：过程中采用支持度的计算方法获得对应结果

工程科学学报，第 39 卷，第 4 期口协议配置输入输出信息与其他仿真模型建立联系．在多个仿真模型组合形成仿真任务时，仿真模型间需要建立一种特殊的关系来确定模型之间资源的传递 ( 如数学仿真模型的输入输出参数信息等) ，这种关系即为仿真模型关联关系．通过构建仿真任务，本文发现能够与同一仿真模型建立关系的几个模型构成的关系在一定程度上不是等价的，即他们与同一模型的亲疏程度有所不同，这种亲疏程度表现出了用户在建立仿真任务时的习惯偏好．本文将这种模型之间的亲疏程度定义为模型关联关系度，将模型关联关系度进行量化分析，可以得到不同模型之间的亲疏程度排序．确定模型关联关系度主要有两种因素，即用户操作信息和模型接口形状，故模型关联关系度可以定义为 d( MA，MB ) = f( Muser，Ninterface ) ． ( 1) 其中，MA、MB 为两个建立关联关系的仿真模型，Muser 为有关用户的信息统计函数，主要由用户已选模型、仿真任务记录、模型库等信息处理得到; Ninterface为基于模型接口形状进行处理所得到的结果．由于模型关联关系具有方向性，因此 d( MA，MB ) ≠d( MB，MA ) ． ( 2) 关联关系度是一个对不同模型关联关系亲疏程度的量化指标．因此与同一个模型建立关系的关联关系度为一个动态值，且存在归一化性质，即 ∑ d( MA，Mi ) = 1． ( 3) 其中，Mi 为任意可以与 MA 建立由 MA 到 Mi 的连接关系的模型．由上述性质可知，模型关联关系度是在一定条件下的概率问题的求解，且其概率密度符合后验分布，相应的求解方法可以贝叶斯统计为基础设计，即 d( MA，Mi ) = f( g( MA，Mi ) | Mi ) π( Mi ) ∑ m i = 1 f( g( MA，Mi ) | Mi ) π( Mi ) ． ( 4) 其中，g( MA，Mi ) 为Mi 的样本信息，f( g( MA，Mi ) | Mi ) 为 Mi 发生的概率密度函数，m 为候选模型个数． 1. 4 接口形状仿真模型在封装后以统一的接口对外表现，主要包括输入接口、输出接口和初始化接口三类，其中输入接口和输出接口是用于在模型之间建立关系的，但不是任意模型之间都能够建立起模型关系，通常对于数学模型来讲，只有输入输出之间存在相同的量纲关系时才能够建立连接关系．由于仿真模型可能包含多个输入或输出，所以本文规定，任意一个输入或输出均为一个模型接口，每个模型接口根据量纲和资源属性确定其接口形状．在不同模型之间，只有含有相同形状的输入接口和输出接口两个模型才能建立关联关系，即: Ｒ( MA，MB ) Out( MA ) ∩ In( MB ) ≠ ． ( 5) 式中，Out( A) 表示 MA 的输出接口形状的集合，In( B) 表示 MB 的输入接口形状的集合，若二者存在上述关系，则可以建立由 MA 到 MB 的连接关系．接口形状池是指所有接口形状的集合，任意仿真模型的输入和输出的接口均为接口形状池的子集，如图 1．将接口形状统计在一个集合下，便于对模型进行检索，给出具有相同接口形状的模型，建立模型间的关联关系．因此，基于接口形状的检索可初步形成候选模型集合，记为接口形状池，这样将为挑选候选模型减少大量的检索工作，加快检索速度．图 1 接口形状及接口形状池 Fig． 1 Interface shape and its pool 2 智能推荐方法设计仿真模型智能推荐方法结合用户使用模型的基本规律和模型的接口形状，根据当前用户所选择模型，智能推算下一个可能用到的模型，为用户设计仿真任务提供参考．该方法主要依靠模型本身的基本属性和统计学方法，快速求取模型关联关系度并以此排序．同时在数据挖掘过程中需要将相关方法依据仿真模型特性重新设计．图 2 是仿真任务智能推荐模块在 GNSS 分布式仿真环境中的基本架构，该模块根据语义管理库中的接口形状池、模型库、仿真任务记录池以及人机交互界面中用户当前选择的部分模型进行检索和推理，最终给出一组经过排序的用户可能即将需要用到的模型集合．图中可以看出，基于接口形状池的初步检索形成了候选模型集合，在依据模型关联关系度的计算和排序，对候选模型进行二次筛选和排序，最终确定了被推荐模型的有序集合． 2. 1 模型关联关系度计算方法模型关联关系度主要根据以往配置信息记录，结合权重的配置进行计算和比较分析．由公式( 1) 可知，关联关系度需结合用户信息和接口形状两个方面进行求解． ( 1) 用户信息部分求解．用户信息部分主要包括对模型库、用户当前操作内容、仿真任务记录等相关信息的统计计算．在统计过程中采用支持度的计算方法获得对应结果． · 826 ·

范国超等：基于关联关系的仿真模型实时智能推荐方法 ·629 由式(7)和式(8)可得接口仿真任务模型库 Me=sup(F。-Ny)UM)· 形状池记录池型 1- sup(F) (9) 系管 sup(F。-N) (2)接口形状部分求解接口形状权重因子在计算过程中主要依据前后模根据智能推荐算法型本身的接口数目和建立关系的接口数目来确定，其初步形成选出可能 K-I项集需要的计算公式如下，摸块并排序模 N..N. 型将结果整理并 Nmd=Ni(N2( (10) 能推送到基于接口其中，N。表示建立连接的接口形状数目，N,m…表示建形状池初步形成人机交互候选项集界面指定立连接模型中的前一个模型输出接口的数目，八2m表检索区域示建立连接模型中后一个模型的输入接口的数目. (3)关联关系度计算. 机点中可以与根据关联关系度的定义和相关性质以及贝叶斯统已选有第N+1个模块提供 N个老模块建立关系的计方法，可定义第n个候选模型对应的关联关系度计候选集当前模块算方法为图2仿真模型推荐算法在平台中的基本交互 d(M,M)= (aM N)/FT Fig.2 Basic interaction of the simulation model illustration 2(a M+aNai)/Fa） algorithm in the platform (11) 故对用户信息部分的统计计算为其中，n表示候选集合中的第n候选模型，m表示候选 Mr=sup(F。UM,). (6) 集合中共有m个模型，F为所有模型与当前模型发其中，sup()为对应模型集合在仿真任务记录中的支生关联的总次数.a1为接口形状权重系数，a2为缺失持度计数，F。表示用户已经配置完的n个模型. 模型后剩余权重系数，且a1+a2=1. 公式(6)在模型检索过程中会出现项集检索计数 a,和a2的值主要由用户进行配置，希望模型的全结果为0的可能性，这时需要项集中排除部分权重较低的模型重新检索，同时检索得到的计数结果需要给部接口能够快速建立连接的用户可以将a,的值配置一个权重系数.故公式(6)可修改为的相对更高一些，而希望参考已有设计任务记录的用 Mm=sup(F。-Ny)UM)×Q,(N).(7) 户可以将α2的值配置的相对更高一些.若a1=0,则其中，Q,(N,)为事务项集中缺失一些模型后的剩余权表示用户完全依据任务设计流程记录对候选模型排重因子，N,是在用户已经配置完成的n个模型中需要序；若α2=0，则表示完全不考虑缺失模型对排序结果去掉的部分模型（可能是一个或多个）的影响，计算结果将主要受两个连接模型的接口形状缺失模型后剩余权重因子需要通过分别求取包含数目和可连接接口形状数目影响用户已选的全部模型和去掉一部分模型的两个集合的公式(11)可化简为支持度，进而通过相应的计算公式得到剩余模型的权 a M+a N 重值.因此Q,(N)的计算方法为 d(M,M)= (12) sup(F) a吧+吧 Q(N)=1- (8) sup (F.-N) 由公式(9)、(10)和(12)可得 af sup((F.-N)UM)1- sup(F) d(M,Ma）= up(F。-N)] Nmo N (13) 豆{ap(R.-)ua)l- sup(F.）1 sup(F-N0)」+a2N,N6l 上述公式对新加入的模型可能会有一定的影响，导致新加入模型始终不能被检测到，因此为了对新加入模型有一定的排序保护，将公式(13)修改为

范国超等: 基于关联关系的仿真模型实时智能推荐方法图 2 仿真模型推荐算法在平台中的基本交互 Fig． 2 Basic interaction of the simulation model illustration algorithm in the platform 故对用户信息部分的统计计算为 Muser = sup( Fn ∪ Mk ) ． ( 6) 其中，sup( ) 为对应模型集合在仿真任务记录中的支持度计数，Fn 表示用户已经配置完的 n 个模型．公式( 6) 在模型检索过程中会出现项集检索计数结果为 0 的可能性，这时需要项集中排除部分权重较低的模型重新检索，同时检索得到的计数结果需要给一个权重系数．故公式( 6) 可修改为 Muser = sup( ( Fn － Nj ) ∪ Mk ) × Q1 ( Nj ) ． ( 7) 其中，Q1 ( Nj ) 为事务项集中缺失一些模型后的剩余权重因子，Nj 是在用户已经配置完成的 n 个模型中需要去掉的部分模型( 可能是一个或多个) ．缺失模型后剩余权重因子需要通过分别求取包含用户已选的全部模型和去掉一部分模型的两个集合的支持度，进而通过相应的计算公式得到剩余模型的权重值．因此 Q1 ( Nj ) 的计算方法为 Q1 ( Nj ) = 1 － sup( Fn ) sup( Fn － Nj ) ． ( 8) 由式( 7) 和式( 8) 可得 Muser = sup( ( Fn － Nj ) ∪ Mk ( ) · 1 － sup( Fn ) sup( Fn － Nj ) ) ． ( 9) ( 2) 接口形状部分求解．接口形状权重因子在计算过程中主要依据前后模型本身的接口数目和建立关系的接口数目来确定，其计算公式如下， Ninterface = Nc N1( out) · Nc N2( in) ． ( 10) 其中，Nc 表示建立连接的接口形状数目，N1( out) 表示建立连接模型中的前一个模型输出接口的数目，N2( in) 表示建立连接模型中后一个模型的输入接口的数目． ( 3) 关联关系度计算．根据关联关系度的定义和相关性质以及贝叶斯统计方法，可定义第 n 个候选模型对应的关联关系度计算方法为 d( MA，M( n) ) = ( a( n) 1 M( n) user + a( n) 2 N( n) interface ) /FTotal ∑ m i = 1 ( ( a( i) 1 M( i) user + a( i) 2 N( i) interface ) /FTotal ) ． ( 11) 其中，n 表示候选集合中的第 n 候选模型，m 表示候选集合中共有 m 个模型，FTotal为所有模型与当前模型发生关联的总次数． a1 为接口形状权重系数，a2 为缺失模型后剩余权重系数，且 a1 + a2 = 1． a1 和 a2 的值主要由用户进行配置，希望模型的全部接口能够快速建立连接的用户可以将 a1 的值配置的相对更高一些，而希望参考已有设计任务记录的用户可以将 a2 的值配置的相对更高一些．若 a1 = 0，则表示用户完全依据任务设计流程记录对候选模型排序; 若 a2 = 0，则表示完全不考虑缺失模型对排序结果的影响，计算结果将主要受两个连接模型的接口形状数目和可连接接口形状数目影响．公式( 11) 可化简为 d( MA，M( n) ) = a( n) 1 M( n) user + a( n) 2 N( n) nterface ∑ m i = 1 a( i) 1 M( i) user + a( i) 2 N( i) interface ． ( 12) 由公式( 9) 、( 10) 和( 12) 可得 d( MA，M( n) ) = a( n) 1 sup( ( Fn － N( n) j ) ∪ M( n) [ ) 1 － sup( Fn ) sup( Fn － N( n) j ] ) + a( n) 2 N( n) c NA( out) N( n) c N( n) ( in) ∑ m i = { 1 ( a( i) 1 sup( ( Fn － N( i) j ) ∪ M( i) [ ) 1 － sup( Fn ) sup( Fn － N( i) j ] ) + a( i) 2 N( i) c NA( out) N( i) c N( i) ( in }) ． ( 13) 上述公式对新加入的模型可能会有一定的影响，导致新加入模型始终不能被检测到，因此为了对新加入模型有一定的排序保护，将公式( 13) 修改为 · 926 ·

·630· 工程科学学报，第39卷，第4期 b+a sup((F.-N)UM)1-- sup(F) p(F,-Na)」 +a0地o NamN高 d(Ma,Mo）= (14) b sup((F.)M)1 sup (F -NO)+a N vo sup(F) b为模型在刚加入平台中时设置的初始数目，为了不影响后续模型的统计信息，b的取值不宜过大，通常选取在100左右，用户可根据个人习惯进行配置. 2.2条件FP-tree数据存储结构设计在对大量仿真任务记录进行检索时，采用频繁模 (DH (D D 式树(FP-4ree)数据记录结构可以加快检索效率. FPAree是做频繁项集等数据挖掘工作常用的数据记录 A 模式如，通常存储的不同事务之间会有若干个相同的 B 项，因此它们在Pree上可能会有部分路径重叠.路径重叠的越多，使用FPAree结构获得的压缩的效果越好四，提高对存储事务检索的速度就越明显，通过支持度阈值或置信度阈值检索效率也就越高。但以仿真图3条件FP4ree数据结构平台中的模型为对象做关联关系检索时，已知参数不 Fig.3 Data structure of the condition FPree 再是支持度阈值或置信度阈值等约束量，而是各个候选模型分别对应的候选项集.这样在考察各个候选模 L=∑ (17) 型对应项集的支持度时均需单独检索FPAree,设每次每个候选模型对应的检索任务量为 FPAree的检索任务量为L,候选模型有m个，用户已选 r=dl+dl2+…+dnlm,d,∈0，p-1].(18) 模型p个，则总检索任务量为根据d,取值范围可得 (19) R,=d,L+d,L+…+dL=∑dL,d,e0,p-l]. r∈D,(p-1)l],ie,m]. 在检索过程中，m个候选模型检索任务总量为 (15) 所以有 Re[A.0-)]= R,∈mL,m(p-1)L. (16) ,(p-1)L],i∈0，m]. (20) 在检索某一候选模型对应的项集时，其他候选模若d=d2=…=dn,则有型对应的FP-ree结点和分支即成为多余检索量.本 R R= (21) 文在FP-ree的基础上，提出了固连结点的概念，在固 m 连结点形成一种具有一定条件约束的FP-ree数据记对比公式(16)可见加入固连结点约束后的录结构.固连结点是把与FPAree根节点直接相连的 FP-ree数据存储结构在候选模型项集检索方面大幅降节点换成固定的连接体，连接体由候选模型对应的节低了检索任务量，由公式(20~21)可以看出，候选模点和当前用户选中模型对应的节点构成.在固连结点型越多检索任务量降低的效果将越明显之后的节点采用与传统FP4ree相同的构建方法，每个 2.3推荐方法流程条件FP-ree的固连结点的数目由候选模型数目决定. 智能推荐方法的工作主要是对模型库、接口形状这样在针对每个候选模型做FPAree检索时，可以直接池、仿真任务记录池等数据记录的一系列检索和计算，检索其对应固连结点的分枝，其余固连结点的分枝直将得到的结果依照模型关联关系度排序后提供给用接做剪枝处理.这样可以节省大量检索时间，提高推户，其主要工作流程如图4. 荐方法效率。 ①根据当前选中的模型，以及接口形状池的记以固连结点为约束条件的FP4ree基本结构如录，在模型库中提取出所有能够与当前选中模型建立图3.图中E、F、G和H为根据接口形状池检索出的候连接关系的模型，组成候选项集Paxm· 选模型，D为当前用户选中的模型，A、B和C为用户已 ②根据候选模型和当前模型的接口数目进行计选的其他模型. 算，得到所有候选模型对应的接口形状权重inere 依据上述方法，假设第个候选模型对应分支的 ③将候选项集P:xm和当前需要建立连接的模检索任务量为1，则有型qn构建固连结点矩阵Pxm'[b。…o]xm]

工程科学学报，第 39 卷，第 4 期 d( MA，M( n) ) = b + a( n) 1 sup( ( Fn － N( n) j ) ∪ M( n) [ ) 1 － sup( Fn ) sup( Fn － N( n) j ] ) + a( n) 2 N( n) c NA( out) N( n) c N( n) ( in) b + ∑ m i = { 1 a( i) 1 sup( ( Fn － N( i) j ) ∪ M( i) [ ) 1 － sup( Fn ) sup( Fn － N( i) j ] ) + a( i) 2 N( i) c NA( out) N( i) c N( i) ( in }) ． ( 14) b 为模型在刚加入平台中时设置的初始数目，为了不影响后续模型的统计信息，b 的取值不宜过大，通常选取在 100 左右，用户可根据个人习惯进行配置． 2. 2 条件 FP-tree 数据存储结构设计在对大量仿真任务记录进行检索时，采用频繁模式树( FP-tree ) 数据记录结构可以加快检索效率． FP-tree是做频繁项集等数据挖掘工作常用的数据记录模式［21］，通常存储的不同事务之间会有若干个相同的项，因此它们在 FP-tree 上可能会有部分路径重叠．路径重叠的越多，使用 FP-tree 结构获得的压缩的效果越好［22］，提高对存储事务检索的速度就越明显，通过支持度阈值或置信度阈值检索效率也就越高．但以仿真平台中的模型为对象做关联关系检索时，已知参数不再是支持度阈值或置信度阈值等约束量，而是各个候选模型分别对应的候选项集．这样在考察各个候选模型对应项集的支持度时均需单独检索 FP-tree，设每次 FP-tree 的检索任务量为 L，候选模型有 m 个，用户已选模型 p 个，则总检索任务量为Ｒt = d1 L + d2 L + … + dm L = ∑ m i = 1 diL，di∈［1，p － 1］． ( 15) 所以有Ｒt∈［mL，m( p － 1) L］． ( 16) 在检索某一候选模型对应的项集时，其他候选模型对应的 FP-tree 结点和分支即成为多余检索量．本文在 FP-tree 的基础上，提出了固连结点的概念，在固连结点形成一种具有一定条件约束的 FP-tree 数据记录结构．固连结点是把与 FP-tree 根节点直接相连的节点换成固定的连接体，连接体由候选模型对应的节点和当前用户选中模型对应的节点构成．在固连结点之后的节点采用与传统 FP-tree 相同的构建方法，每个条件 FP-tree 的固连结点的数目由候选模型数目决定．这样在针对每个候选模型做 FP-tree 检索时，可以直接检索其对应固连结点的分枝，其余固连结点的分枝直接做剪枝处理．这样可以节省大量检索时间，提高推荐方法效率．以固连结点为约束条件的 FP-tree 基本结构如图 3．图中 E、F、G 和 H 为根据接口形状池检索出的候选模型，D 为当前用户选中的模型，A、B 和 C 为用户已选的其他模型．依据上述方法，假设第 i 个候选模型对应分支的检索任务量为 li，则有图 3 条件 FP-tree 数据结构 Fig． 3 Data structure of the condition FP-tree L = ∑ m i = 1 li ． ( 17) 每个候选模型对应的检索任务量为 ri = d1 l1 + d2 l2 + … + dm lm，di∈［1，p － 1］． ( 18) 根据 di 取值范围可得 ri∈［li，( p － 1) li］，i∈［1，m］． ( 19) 在检索过程中，m 个候选模型检索任务总量为Ｒ't∈ [ ∑ m i = 1 li，( p － 1) ∑ m i = 1 li ] = ［L，( p － 1) L］，i∈［1，m］． ( 20) 若 d1 = d2 = … = dm，则有Ｒ't = Ｒt m ． ( 21) 对比公式 ( 16 ) 可见加入固连结点约束后的 FP-tree数据存储结构在候选模型项集检索方面大幅降低了检索任务量，由公式( 20 ～ 21) 可以看出，候选模型越多检索任务量降低的效果将越明显． 2. 3 推荐方法流程智能推荐方法的工作主要是对模型库、接口形状池、仿真任务记录池等数据记录的一系列检索和计算，将得到的结果依照模型关联关系度排序后提供给用户，其主要工作流程如图 4． ① 根据当前选中的模型，以及接口形状池的记录，在模型库中提取出所有能够与当前选中模型建立连接关系的模型，组成候选项集 P( 1 × m) ． ② 根据候选模型和当前模型的接口数目进行计算，得到所有候选模型对应的接口形状权重 Ninterface ． ③ 将候选项集 P( 1 × m) 和当前需要建立连接的模型 qn 构建固连结点矩阵［PT ( 1 × m)，［on … on］T ( 1 × m) ］， · 036 ·

点击进入文档下载页（PDF格式）

共8页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录

基于关联关系的仿真模型实时智能推荐方法