第11卷第4期 智能系统学报 Vol.11 No.4 2016年8月 CAAI Transactions on Intelligent Systems Aug.2016 D0I:10.11992/is.201606001 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP.20160808.0831.034.html 基于演化博弈论的网络信息传播群体行为分析 郭艳燕,童向荣,张楠,王莹洁 (烟台大学计算机与控制工程学院,山东烟台264005) 摘要:以网络信息传播为背景,针对网络信息传播群体,对群体的静态结构和动态行为进行抽象和分析。以前期 使用经典博弈论来分析传播个体行为的研究为基础,建立符合网络信息传播特性的演化博弈模型来刻画网络信息 传播群体的交互行为,采用有限理性Agmt来模拟真实网络信息传播环境下的信息传播者,使用演化稳定策略和复 制者动态对网络信息传播单群体的行为进行静态和动态均衡的分析,并通过计算验证了网络信息传播群体的稳定 结构与群体行为的动态均衡具有很强的关联性。 关键词:演化博弈论:演化稳定策略:复制者动态:有限理性:Aget:单群体:动态均衡 中图分类号:TP18文献标志码:A文章编号:1673-4785(2016)04-0487-09 中文引用格式:郭艳燕,童向荣,张楠,等.基于演化博弈论的网络信息传播群体行为分析[J].智能系统学报,2016,11(4):487- 495. 英文引用格式:GUO Yanyan,TONG Xiangrong,ZHANG Nan,etal.Analysis of network information propagation population be- havior based on evolutionary game theory[J].CAAI Transactions on Intelligent Systems,2016,11(4):487-495. Analysis of network information propagation population behavior based on evolutionary game theory GUO Yanyan,TONG Xiangrong,ZHANG Nan,WANG Yingjie (School of Computer and Control Engineering,Yantai University,Yantai 264005,China) Abstract:To address the behavior of information propagation population within the research background of network information propagation,the abstraction and analysis of its static structure and dynamic behavior are investigated in this paper.Based on previous research work on individual behavior applying classic game theory,an evolutionary game model was built to simulate the interaction of information propagation population in line with network informa- tion dissemination characteristics.Evolutionary game theory was used to analyze the effect of the dynamic evolution- ary process on population behavior.A bounded rationality agent was used to simulate message senders in a social network.An evolutionary stable strategy and replicator dynamics were used to analyze the static and dynamic equi- librium of the population behavior.We conclude that there is a strong correlation between the stability structure of the network information propagation population and the dynamic equilibrium of group behavior. Keywords:evolutionary game theory;evolutionary stable strategies;replicator dynamics;bounded rationality;a- gent;monomorphic population;dynamics equilibrium 网络信息传播是人类借助网络传递或交流信息 利用。网络信息传播作为一种信息传播活动有其发 的社会性行为,目的是使信息得以广泛散发、吸收和 展、变化的动态规律,并且与网络信息传播群体的行 为紧密相关。网络信息传播群体是通过网络信息将 收稿日期:2016-06-01.网络出版日期:2016-08-08. 网络中具有交互关系的个体联系在一起形成一种新 基金项目:国家自然科学基金项目(61403329,61502410,61572418); 山东省自然科学基金项目(ZR2015PF010,ZR2013FQ020, 型的网络虚拟群体,具有相同行为的个体构建出同 ZR2014FL009,ZR2014FQ016):山东省高等学校科技计划项 目(J15LN09,J14LN23). 一类型的单群体。根据信息传播行为的不同,可将 通信作者:郭艳燕.E-mail:smallgyy@sina.com
第 11 卷第 4 期 智 能 系 统 学 报 Vol.11 №.4 2016 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2016 DOI:10.11992 / tis.201606001 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160808.0831.034.html 基于演化博弈论的网络信息传播群体行为分析 郭艳燕,童向荣,张楠,王莹洁 (烟台大学 计算机与控制工程学院,山东 烟台 264005) 摘 要:以网络信息传播为背景,针对网络信息传播群体,对群体的静态结构和动态行为进行抽象和分析。 以前期 使用经典博弈论来分析传播个体行为的研究为基础,建立符合网络信息传播特性的演化博弈模型来刻画网络信息 传播群体的交互行为,采用有限理性 Agent 来模拟真实网络信息传播环境下的信息传播者,使用演化稳定策略和复 制者动态对网络信息传播单群体的行为进行静态和动态均衡的分析,并通过计算验证了网络信息传播群体的稳定 结构与群体行为的动态均衡具有很强的关联性。 关键词:演化博弈论;演化稳定策略;复制者动态;有限理性;Agent;单群体;动态均衡 中图分类号: TP18 文献标志码:A 文章编号:1673-4785(2016)04-0487-09 中文引用格式:郭艳燕,童向荣,张楠,等. 基于演化博弈论的网络信息传播群体行为分析[ J]. 智能系统学报, 2016, 11(4): 487- 495. 英文引用格式:GUO Yanyan, TONG Xiangrong, ZHANG Nan, et al. Analysis of network information propagation population be⁃ havior based on evolutionary game theory[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 487-495. Analysis of network information propagation population behavior based on evolutionary game theory GUO Yanyan, TONG Xiangrong, ZHANG Nan, WANG Yingjie (School of Computer and Control Engineering , Yantai University, Yantai 264005, China) Abstract:To address the behavior of information propagation population within the research background of network information propagation, the abstraction and analysis of its static structure and dynamic behavior are investigated in this paper. Based on previous research work on individual behavior applying classic game theory, an evolutionary game model was built to simulate the interaction of information propagation population in line with network informa⁃ tion dissemination characteristics. Evolutionary game theory was used to analyze the effect of the dynamic evolution⁃ ary process on population behavior. A bounded rationality agent was used to simulate message senders in a social network. An evolutionary stable strategy and replicator dynamics were used to analyze the static and dynamic equi⁃ librium of the population behavior. We conclude that there is a strong correlation between the stability structure of the network information propagation population and the dynamic equilibrium of group behavior. Keywords:evolutionary game theory; evolutionary stable strategies; replicator dynamics; bounded rationality; a⁃ gent; monomorphic population; dynamics equilibrium 收稿日期:2016-06-01. 网络出版日期:2016-08-08. 基金项目:国家自然科学基金项目( 61403329, 61502410, 61572418); 山东省自然科学基金项目( ZR2015PF010, ZR2013FQ020, ZR2014FL009, ZR2014FQ016);山东省高等学校科技计划项 目(J15LN09, J14LN23). 通信作者:郭艳燕. E⁃mail:smallgyy@ sina.com. 网络信息传播是人类借助网络传递或交流信息 的社会性行为,目的是使信息得以广泛散发、吸收和 利用。 网络信息传播作为一种信息传播活动有其发 展、变化的动态规律,并且与网络信息传播群体的行 为紧密相关。 网络信息传播群体是通过网络信息将 网络中具有交互关系的个体联系在一起形成一种新 型的网络虚拟群体,具有相同行为的个体构建出同 一类型的单群体。 根据信息传播行为的不同,可将
.488 智能系统学报 第11卷 网络信息传播群体分为信息发送单群体和信息接收 行为的动力学机制,即所有超出平均收益的纯策略 单群体。 都具有正的增长率,而所有低于平均收益的纯策略 网络信息传播具有以下两个重要特性: 都具有负的增长率。 1)网络信息传播具有流动性。网络信息的传 本文的主要贡献在于将演化博弈论应用到分析 播者将所拥有的信息发送给信息接收者,本轮信息 网络信息传播单群体行为的研究中。通过对网络信 传播过程完成后,信息传播并没有终止,而是信息的 息传播单群体中随机个体的交互博弈分析,描述信 接收者瞬间又成为信息的拥有者,开始下一轮信息 息传播群体行为的动态演化过程以及动态均衡下的 传播过程,网络信息传播在这种循环往复的过程中 策略选择,并为下一步的信息传播多群体间的行为 进行; 研究打下理论基础。为了建立形式化的演化博弈模 2)网络信息传播具有主体性。信息传播个体 型并为下一步的模拟实验打下基础,本文将网络环 具有主动的行为,传播个体的行为选择机制影响着 境中的真实信息传播个体用多Agent系统[]中的 信息传播过程。在网络信息传播过程中,传播主体 Agent进行模拟,来帮助分析网络信息传播群体的 追求传播效用,即网络中拥有信息的个体为了实现 行为决策。通过对用户的行为规律进行深入挖掘分 某种自身的利益诉求,采取能够获取更多收益的信 析,从而为进一步网络信息预测和控制的研究和 息发送策略,例如发送真实信息或对信息进行加工 应用打下基础。 处理形成失真信息进行发送。对于信息的接收者又 会对接收到的信息进行策略选择,例如对接收到的 1研究机制及方法 信息进行直接转发或者加工后转发。网络信息传播 1.1演化博弈论 过程中的策略选择,使传播主体之间形成了互动关 演化博弈理论是一种适合解决网络中动态博弈 系,产生了信息传播者之间的行为博弈,并促成了信 问题的方法。在网络信息传播的应用背景下,使用 息传播群体的行为演化。 演化博弈)相对经典博弈来对信息传播行为进行 在网络信息传播的研究中,为了能够更真实地 研究,具有以下优势: 反映行为主体的多样性和复杂性,并且可以为宏观 1)经典博弈要求参与者具有绝对理性,包括目 调控群体行为提供理论依据,需要对网络信息传播 标理性和过程理性。参与者以追求收益最大化为目 群体的动态行为进行抽象和分析。演化博弈论) 的,并可以准确无误地选择最优反应策略。完全理 以具有有限理性的参与人群体为研究对象,把博弈 性在现实中很难满足,尤其是当应用环境和决策问 理论分析和动态演化过程分析结合起来。在方法论 题较复杂时,参与者存在很大的理性局限,从而对参 上,它不同于经典博弈论将重点放在静态的均衡,而 与者的决策和行为选择方式会产生很大影响。因 强调的是一种动态的均衡,关注群体行为的动态演 此,在网络信息传播的应用背景下,采用有限理性的 化过程。 演化博弈进行分析更加适用。 本文构造了符合网络信息传播特性的演化博弈 2)经典博弈是一种静态博弈,能够使个体在瞬 模型,克服了使用其他模型存在的非主体性问题。 间获取最优结果从而达到静态均衡。在网络信息传 由于网络信息传播具有流动性的特点,在研究过程 播的大平台下,由于信息具有流动性,信息在网络中 中将信息接收单群体同样作为信息发送单群体来看 的广泛传播需要一定的时间阶段,且不可忽略,同时 待,仅形成同一类的信息传播者单群体。网络信息 个体的信息传播行为随时间和交互次数进行动态调 传播群体中的个体发送真实信息和发送失真信息获 整从而达到动态均衡。因此,在网络信息传播的应 得不同收益的行为关系在本文中使用构建的演化博 用背景下,采用能够体现动态特性的演化博弈进行 弈模型来描述和分析,个体在寻求自身利益的交互 分析更加适用。 过程中相互制约,最终形成群体行为的平衡点。 3)经典博弈主要关注参与者的个体行为。在 在研究演化稳定策略ESS(evolutionary stable 网络大环境中,个体行为并不能对整个网络产生足 strategies)的同时,也需要对群体行为的动态演化过 够的影响,能对网络信息传播产生严重影响的是群 程进行刻画,从动力学角度分析稳定均衡。在网络 体行为,并且群体行为的变化是一个长期动态调整 信息传播群体中,信息的传播和信息传播群体行为 的过程。因此,在网络信息传播的应用背景下,采用 的选择都遵从某种规律的动力学。本文采用属于收 研究群体行为的演化博弈进行分析更加适用。 益正性动态的复制者动态)模型来刻画网络群体 4)在网络信息传播的应用背景下,信息传播个
网络信息传播群体分为信息发送单群体和信息接收 单群体。 网络信息传播具有以下两个重要特性: 1)网络信息传播具有流动性。 网络信息的传 播者将所拥有的信息发送给信息接收者,本轮信息 传播过程完成后,信息传播并没有终止,而是信息的 接收者瞬间又成为信息的拥有者,开始下一轮信息 传播过程,网络信息传播在这种循环往复的过程中 进行; 2)网络信息传播具有主体性。 信息传播个体 具有主动的行为,传播个体的行为选择机制影响着 信息传播过程。 在网络信息传播过程中,传播主体 追求传播效用,即网络中拥有信息的个体为了实现 某种自身的利益诉求,采取能够获取更多收益的信 息发送策略,例如发送真实信息或对信息进行加工 处理形成失真信息进行发送。 对于信息的接收者又 会对接收到的信息进行策略选择,例如对接收到的 信息进行直接转发或者加工后转发。 网络信息传播 过程中的策略选择,使传播主体之间形成了互动关 系,产生了信息传播者之间的行为博弈,并促成了信 息传播群体的行为演化。 在网络信息传播的研究中,为了能够更真实地 反映行为主体的多样性和复杂性,并且可以为宏观 调控群体行为提供理论依据,需要对网络信息传播 群体的动态行为进行抽象和分析。 演化博弈论[1] 以具有有限理性的参与人群体为研究对象,把博弈 理论分析和动态演化过程分析结合起来。 在方法论 上,它不同于经典博弈论将重点放在静态的均衡,而 强调的是一种动态的均衡,关注群体行为的动态演 化过程。 本文构造了符合网络信息传播特性的演化博弈 模型,克服了使用其他模型存在的非主体性问题。 由于网络信息传播具有流动性的特点,在研究过程 中将信息接收单群体同样作为信息发送单群体来看 待,仅形成同一类的信息传播者单群体。 网络信息 传播群体中的个体发送真实信息和发送失真信息获 得不同收益的行为关系在本文中使用构建的演化博 弈模型来描述和分析,个体在寻求自身利益的交互 过程中相互制约,最终形成群体行为的平衡点。 在研究演化稳定策略 ESS ( evolutionary stable strategies)的同时,也需要对群体行为的动态演化过 程进行刻画,从动力学角度分析稳定均衡。 在网络 信息传播群体中,信息的传播和信息传播群体行为 的选择都遵从某种规律的动力学。 本文采用属于收 益正性动态的复制者动态[2] 模型来刻画网络群体 行为的动力学机制,即所有超出平均收益的纯策略 都具有正的增长率,而所有低于平均收益的纯策略 都具有负的增长率。 本文的主要贡献在于将演化博弈论应用到分析 网络信息传播单群体行为的研究中。 通过对网络信 息传播单群体中随机个体的交互博弈分析,描述信 息传播群体行为的动态演化过程以及动态均衡下的 策略选择,并为下一步的信息传播多群体间的行为 研究打下理论基础。 为了建立形式化的演化博弈模 型并为下一步的模拟实验打下基础,本文将网络环 境中的真实信息传播个体用多 Agent 系统[3] 中的 Agent 进行模拟,来帮助分析网络信息传播群体的 行为决策。 通过对用户的行为规律进行深入挖掘分 析,从而为进一步网络信息预测和控制[4] 的研究和 应用打下基础。 1 研究机制及方法 1.1 演化博弈论 演化博弈理论是一种适合解决网络中动态博弈 问题的方法。 在网络信息传播的应用背景下,使用 演化博弈[5] 相对经典博弈来对信息传播行为进行 研究,具有以下优势: 1)经典博弈要求参与者具有绝对理性,包括目 标理性和过程理性。 参与者以追求收益最大化为目 的,并可以准确无误地选择最优反应策略。 完全理 性在现实中很难满足,尤其是当应用环境和决策问 题较复杂时,参与者存在很大的理性局限,从而对参 与者的决策和行为选择方式会产生很大影响。 因 此,在网络信息传播的应用背景下,采用有限理性的 演化博弈进行分析更加适用。 2)经典博弈是一种静态博弈,能够使个体在瞬 间获取最优结果从而达到静态均衡。 在网络信息传 播的大平台下,由于信息具有流动性,信息在网络中 的广泛传播需要一定的时间阶段,且不可忽略,同时 个体的信息传播行为随时间和交互次数进行动态调 整从而达到动态均衡。 因此,在网络信息传播的应 用背景下,采用能够体现动态特性的演化博弈进行 分析更加适用。 3)经典博弈主要关注参与者的个体行为。 在 网络大环境中,个体行为并不能对整个网络产生足 够的影响,能对网络信息传播产生严重影响的是群 体行为,并且群体行为的变化是一个长期动态调整 的过程。 因此,在网络信息传播的应用背景下,采用 研究群体行为的演化博弈进行分析更加适用。 4)在网络信息传播的应用背景下,信息传播个 ·488· 智 能 系 统 学 报 第 11 卷
第4期 郭艳燕,等:基于演化博弈论的网络信息传播群体行为分析 .489. 体之间随机地发生交互,个体间进行的是多次博弈, 2 建立模型 且两次遇到相同个体的概率很小,因此采用演化博 弈对传播行为进行研究可以避免经典博弈理论中个 2.1前提条件 体记忆的概念,具有更简洁的理论框架,因此更适合 本文基于Agent的网络信息传播群体行为的演 应用到网络信息传播群体行为的研究中。 化博弈分析的前提如下。 1.2复制者动态学习模型 1)进行的是网络信息传播单群体的行为演化分 演化博弈论的有限理性体现在参与者的学习能 析,这种分析思路符合网络信息流动性的特点。 力上,参与者的行为选择可以依据前人的经验、学习 2)是从全局进行考察,网络上的每个人都可以 与模仿他人行为,在博弈过程中通过动态学习寻找 作为信息的传播者。在进行信息传播时,信息传播 较好的策略。选择动态模拟演化博弈中参与者的学 者的策略分为对所拥有信息进行真实发送,或者对 习和决策过程,来刻画有限理性下的决策机制和群 信息进行加工处理成失真信息后发送。 体行为的动态演化。演化博弈基本的选择动态如式 3)在演化博弈分析时,不考虑决策环境中的不 (1)所示。 确定性对策略选择的影响,因此群体行为的动态演 8()sd 化过程是一种无突变的选择学习]。 =0.(t)·g(t) (1) dt 4)用Agent群体模拟信息发送群体,群体中的 式中:O(t)表示在t时刻选择策略i的个体在群体 每一个信息传播个体用一个Agent个体表示。 中所占的比例;函数g:(t)表示具体的选择过程,不 5)以网络信息传播为研究背景,网络中信息传 同的学习选择机制对应不同的函数。 播者群体庞大,因此用来进行行为模拟的Agent群 复制者动态是针对学习速度较慢的成员组成的 体中的个体都属于同一类单群体,且数量足够大并 大群体进行随机配对反复博弈时采用的选择动态, 混合均匀,即群体中任意两个个体等可能地进行随 能用来描述单群体策略的动态调整过程[6],如式2 机博弈。 所示,0:的增长率是选择策略s:的效用u,(s:)与群 2.2演化博弈模型的形式化定义 体平均效用山,差的严格增函数,体现在成功的策略 网络信息传播中,Agent个体的适应性是指它 由于其高收益而在群体中不断采纳刀。同时复制 和群体中一个随机相遇的Agent互动得到的预期收 者动态能够描述没有明显结构的无限人口中的各种 益。群体中任意两个Agent相遇进行博弈的收益矩 策略的占有率随着时间的变化) 阵,如图1所示,51表示发送真实信息,$2表示发送 失真信息。由于进行的是单群体博弈分析,因此建 0(t)=0.(t)·[u,(s:)-u,] (2) 立的收益矩阵是对称的。 由于在网络信息传播过程中,网络上的每个点 Agent, 都可以成为信息传播的参与者且数量巨大,因此本 文对网络信息传播群体进行演化博弈分析时采用复 制者动态学习模型是适用的。 Agent, B l.3有限理性Agent 为了利于形式化建模和分析,以及为下一步的 图1群体中两个Agent交互时的收益矩阵(B>A>C) 模拟实验奠定基础,可以用具有有限理性)和学习 Fig.1 Pay-off matrix of two interactive Agents B >A C) 能力的Agent来模拟演化博弈模型中的参与者。在 网络背景下,之所以存在发送失真信息的策略, 演化博弈研究中,参与者只需要具有有限理性和学 是因为网络信息传播者具有主体性且信息本身具有 习能力,智能体Agent正好符合这一特性。Agent的 不确定性,因此存在发送失真信息会带来更多收益 理性在于多Agent交互时,能够在多个可能策略选 的可能性。在图1矩阵中,B>A对应现实中的情 择间做出合理的选择。在多Agent系统中,Agent不 景是通过发送某些虚假信息或通过造谣来达到信息 是孤立存在的,但Agent的资源和能力却是有限的, 真假难辨的目的从而获利,博弈双方策略不同时,发 Agent的行为必须满足某种理性1o),但很难满足逻 送失真信息获得的收益大于发送真实信息获得的收 辑理性和效用理性。同时,Agent具有学习能力, 益。C<A对应现实中的情景是如果博弈双方都发 因此Agent是有限理性而不是完全理性的。 送虚假信息会导致社会不信任的出现,从而小于双 本文在网络信息传播背景下,使用Agent来模 方都发送真实信息的收益。为了方便计算,将C取 拟有限理性的真实信息传播者是合理的。 值为B/2
体之间随机地发生交互,个体间进行的是多次博弈, 且两次遇到相同个体的概率很小,因此采用演化博 弈对传播行为进行研究可以避免经典博弈理论中个 体记忆的概念,具有更简洁的理论框架,因此更适合 应用到网络信息传播群体行为的研究中。 1.2 复制者动态学习模型 演化博弈论的有限理性体现在参与者的学习能 力上,参与者的行为选择可以依据前人的经验、学习 与模仿他人行为,在博弈过程中通过动态学习寻找 较好的策略。 选择动态模拟演化博弈中参与者的学 习和决策过程,来刻画有限理性下的决策机制和群 体行为的动态演化。 演化博弈基本的选择动态如式 (1)所示。 θi · (t) = dθi dt = θi(t)·gi(t) (1) 式中: θi(t) 表示在 t 时刻选择策略 i 的个体在群体 中所占的比例;函数 gi(t) 表示具体的选择过程,不 同的学习选择机制对应不同的函数。 复制者动态是针对学习速度较慢的成员组成的 大群体进行随机配对反复博弈时采用的选择动态, 能用来描述单群体策略的动态调整过程[6] ,如式 2 所示, θi 的增长率是选择策略 si 的效用 ut(si) 与群 体平均效用 u - t 差的严格增函数,体现在成功的策略 由于其高收益而在群体中不断采纳[7] 。 同时复制 者动态能够描述没有明显结构的无限人口中的各种 策略的占有率随着时间的变化[8] 。 θi · (t) = θi(t)·[ut(si) - u - t] (2) 由于在网络信息传播过程中,网络上的每个点 都可以成为信息传播的参与者且数量巨大,因此本 文对网络信息传播群体进行演化博弈分析时采用复 制者动态学习模型是适用的。 1.3 有限理性 Agent 为了利于形式化建模和分析,以及为下一步的 模拟实验奠定基础,可以用具有有限理性[9] 和学习 能力的 Agent 来模拟演化博弈模型中的参与者。 在 演化博弈研究中,参与者只需要具有有限理性和学 习能力,智能体 Agent 正好符合这一特性。 Agent 的 理性在于多 Agent 交互时,能够在多个可能策略选 择间做出合理的选择。 在多 Agent 系统中,Agent 不 是孤立存在的,但 Agent 的资源和能力却是有限的, Agent 的行为必须满足某种理性[10] ,但很难满足逻 辑理性和效用理性[11] 。 同时,Agent 具有学习能力, 因此 Agent 是有限理性而不是完全理性的。 本文在网络信息传播背景下,使用 Agent 来模 拟有限理性的真实信息传播者是合理的。 2 建立模型 2.1 前提条件 本文基于 Agent 的网络信息传播群体行为的演 化博弈分析的前提如下。 1)进行的是网络信息传播单群体的行为演化分 析,这种分析思路符合网络信息流动性的特点。 2)是从全局进行考察,网络上的每个人都可以 作为信息的传播者。 在进行信息传播时,信息传播 者的策略分为对所拥有信息进行真实发送,或者对 信息进行加工处理成失真信息后发送。 3)在演化博弈分析时,不考虑决策环境中的不 确定性对策略选择的影响,因此群体行为的动态演 化过程是一种无突变的选择学习[12] 。 4)用 Agent 群体模拟信息发送群体,群体中的 每一个信息传播个体用一个 Agent 个体表示。 5)以网络信息传播为研究背景,网络中信息传 播者群体庞大,因此用来进行行为模拟的 Agent 群 体中的个体都属于同一类单群体,且数量足够大并 混合均匀,即群体中任意两个个体等可能地进行随 机博弈。 2.2 演化博弈模型的形式化定义 网络信息传播中,Agent 个体的适应性是指它 和群体中一个随机相遇的 Agent 互动得到的预期收 益。 群体中任意两个 Agent 相遇进行博弈的收益矩 阵,如图 1 所示, s1 表示发送真实信息, s2 表示发送 失真信息。 由于进行的是单群体博弈分析,因此建 立的收益矩阵是对称的。 图 1 群体中两个 Agent 交互时的收益矩阵( B > A > C ) Fig.1 Pay⁃off matrix of two interactive Agents ( B > A > C ) 网络背景下,之所以存在发送失真信息的策略, 是因为网络信息传播者具有主体性且信息本身具有 不确定性,因此存在发送失真信息会带来更多收益 的可能性。 在图 1 矩阵中, B > A 对应现实中的情 景是通过发送某些虚假信息或通过造谣来达到信息 真假难辨的目的从而获利,博弈双方策略不同时,发 送失真信息获得的收益大于发送真实信息获得的收 益。 C < A 对应现实中的情景是如果博弈双方都发 送虚假信息会导致社会不信任的出现,从而小于双 方都发送真实信息的收益。 为了方便计算,将 C 取 值为 B/ 2。 第 4 期 郭艳燕,等:基于演化博弈论的网络信息传播群体行为分析 ·489·
.490 智能系统学报 第11卷 定义1六元组〈N,S,U,P,E,S°〉为网络信 策略纳什均衡,并且是非严格对称纳什均衡。 息传播中,用多Agent模拟的信息传播群体的演化 将随机因素引入到参与者Agent的行为选择中, 博弈模型,其中 Agent以p(0<p<1)概率发送真实信息,以1-p l)N={Agent1,Agent2,…,Agent.,}为Agent同 概率发送失真信息。Agent发送真实信息和发送失真 类群体,Agent群体中的任何一个Agent:都可以发 信息的期望收益如式(3)所示,收益曲线如图2。 送信息。 2)因为N是同一群体,因此N中的每一个 E(s1)=p·A+(1-p)·A Agent,,都有相同的策略备选项集S={s1,s2},其中 (3) E(s2)=p·B+(1-p)·B/2 s1和2都表示纯策略。该模型中,S1表示发送真实 信息,52表示发送失真信息。 网络信息传播群体期望收益 3)U={U1,U2,…,Un},U是Agent:的收益函 —Es,) --·Es) 数,U(s,)表示在纯策略组合(s)之下 Agent,的收益值,Sn∈S,n∈S。表1为Agent1、 Agent,交互双方策略组合的收益函数列表。 表1群体中两个交互Agent双方的收益函数(2A>B>A) Table 1 Pay-off function of two interactive Agents 2A B>A) B/2 Agent,的收益函数 Agent,.的收益函数 0 (2*A-B)/B p ,(s1,s1)=A U2(31,s1)=A 图2个体Agent的收益曲线图 U,(s1,s2)=A U2(s1,s2)=B Fig.2 Pay-off diagram of individual Agent U(s2,1)=B U2(s2,s1)=A 对于Agent群体中的个体来说,在静态博弈下 U,(s2,s2)=B/2 U2(s2,s2)=B/2 通过式(4)的求解过程,获知Agent以概率p= 4)P是混合策略集,是将策略备选项集的空间 (2A-B)/B发送真实信息,以概率1-(2A-B)/B 从有限纯策略集S扩展到S的概率分布空间。 发送失真信息是混合策略纳什均衡,并且是对称混 P={P1,P2,…,Pm} 合纳什均衡。 式中:P:是Agent,,的混合策略概率,即Agent,,采用 E(s1)=E(s2)→p=(2A-B)/B(4) 以P:发送真实信息,以1-P:发送失真信息的混合 3.2演化稳定策略的分析 策略,且0<P:<1。 定义2演化稳定策略[)。策略T以x占比入 5)E(s:)是Agent,采取策略s的期望收益函 侵策略S,表示总体中有x占比的群体采用策略T, 数,s:∈S,i=1,2。 1-x占比的群体采用策略S,其中x是一个小于1 6)S·为建立的演化博弈模型的演化稳定策略 的正数。假设存在一个正数y,当任何其他策略T (ESS)的集合。若存在s·∈P,对于所有的s∈P 以任何x<y的程度入侵策略S时,采用策略S的个 且s≠s·,满足E(s·)>E(s),则s·为演化博弈 体适应性严格高于采用策略T的个体适应性,则称 模型的ESS,即s·∈S·,s·可以是演化稳定纯策 策略S是演化稳定的。策略T和S是纯策略时,策 略,也可以是演化稳定混合策略。 略S是演化稳定纯策略。如果T和S中存在随机因 3群体行为的演化博弈分析 素,是两种不同概率的策略组合时,策略S是演化稳 定混合策略。 31群体中个体行为的经典博弈分析 演化稳定策略是演化博弈的静态均衡,根据建 因为网络信息传播个体行为对网络信息传播群 立的网络信息传播群体的演化博弈模型,结合定义 体行为的涌现趋势和演化结果有重要的影响,即网 2进行模型演化稳定策略的分析,具体过程如下。 络群体行为的形成是离不开群体内的个体行为。因 1)分析发送真实信息的策略是否是ESS,即判 此,对于个体信息传播行为进行建模、分析和预测也 断以x占比发送失真信息的群体入侵以1-x占比 是网络信息群体行为研究中的重要内容。 发送真实信息的群体时,期望收益E(s,)是否大于 结合图1中的收益矩阵进行完全信息静态博弈 期望收益E(s2)、E(s1)和E(s2)如式5所示。 分析,博弈双方的策略组合(s1,32)和(s2,S1)为纯
定义 1 六元组 N,S,U,P,E,S ∗ 为网络信 息传播中,用多 Agent 模拟的信息传播群体的演化 博弈模型,其中 1) N = {Agent 1 ,Agent 2 ,...,Agent n } 为 Agent 同 类群体,Agent 群体中的任何一个 Agent i 都可以发 送信息。 2) 因为 N 是同一群体,因此 N 中的每一个 Agent i 都有相同的策略备选项集 S = {s1 ,s2 } ,其中 s1 和 s2 都表示纯策略。 该模型中, s1 表示发送真实 信息, s2 表示发送失真信息。 3) U = {U1 ,U2 ,…,Un } , Ui 是 Agent i 的收益函 数, Ui(sj1 ,sj2 ) 表 示 在 纯 策 略 组 合 (sj1 ,sj2 ) 之 下 Agent i 的收益值, sj1 ∈ S,sj2 ∈ S 。 表 1 为 Agent 1 、 Agent 2 交互双方策略组合的收益函数列表。 表 1 群体中两个交互 Agent 双方的收益函数( 2A > B > A ) Table 1 Pay⁃off function of two interactive Agents ( 2A > B > A ) Agent 1 的收益函数 Agent 2 的收益函数 U1(s1 ,s1 ) = A U2(s1 ,s1 ) = A U1(s1 ,s2 ) = A U2(s1 ,s2 ) = B U1(s2 ,s1 ) = B U2(s2 ,s1 ) = A U1(s2 ,s2 ) = B/ 2 U2(s2 ,s2 ) = B/ 2 4) P 是混合策略集,是将策略备选项集的空间 从有限纯策略集 S 扩展到 S 的概率分布空间。 P = {p1 ,p2 ,…,pn } 式中: Pi 是 Agent i 的混合策略概率, 即 Agent i 采用 以 Pi 发送真实信息,以 1 - pi 发送失真信息的混合 策略,且 0 < pi < 1。 5) E(si) 是 Agent i 采取策略 si 的期望收益函 数, si ∈ S , i = 1,2。 6) S ∗ 为建立的演化博弈模型的演化稳定策略 (ESS)的集合。 若存在 s ∗ ∈ P ,对于所有的 s ∈ P 且 s ≠ s ∗ ,满足 E(s ∗ ) > E(s) ,则 s ∗ 为演化博弈 模型的 ESS,即 s ∗ ∈ S ∗ , s ∗ 可以是演化稳定纯策 略,也可以是演化稳定混合策略。 3 群体行为的演化博弈分析 3.1 群体中个体行为的经典博弈分析 因为网络信息传播个体行为对网络信息传播群 体行为的涌现趋势和演化结果有重要的影响,即网 络群体行为的形成是离不开群体内的个体行为。 因 此,对于个体信息传播行为进行建模、分析和预测也 是网络信息群体行为研究中的重要内容。 结合图 1 中的收益矩阵进行完全信息静态博弈 分析,博弈双方的策略组合 (s1 ,s2 ) 和 (s2 ,s1 ) 为纯 策略纳什均衡,并且是非严格对称纳什均衡。 将随机因素引入到参与者 Agent 的行为选择中, Agent 以 p (0 < p < 1) 概率发送真实信息,以 1 - p 概率发送失真信息。 Agent 发送真实信息和发送失真 信息的期望收益如式(3)所示,收益曲线如图 2。 E(s1 ) = p·A + (1 - p)·A E(s2 ) = p·B + (1 - p)·B / 2 (3) 图 2 个体 Agent 的收益曲线图 Fig.2 Pay⁃off diagram of individual Agent 对于 Agent 群体中的个体来说,在静态博弈下 通过式 ( 4) 的求解过程, 获知 Agent 以概率 p = (2A -B) / B 发送真实信息,以概率 1 - (2A - B) / B 发送失真信息是混合策略纳什均衡,并且是对称混 合纳什均衡。 E(s1 ) = E(s2 )⇒p = (2A - B) / B (4) 3.2 演化稳定策略的分析 定义 2 演化稳定策略[9] 。 策略 T 以 x 占比入 侵策略 S ,表示总体中有 x 占比的群体采用策略 T , 1 - x 占比的群体采用策略 S ,其中 x 是一个小于 1 的正数。 假设存在一个正数 y ,当任何其他策略 T 以任何 x < y 的程度入侵策略 S 时,采用策略 S 的个 体适应性严格高于采用策略 T 的个体适应性,则称 策略 S 是演化稳定的。 策略 T 和 S 是纯策略时,策 略 S 是演化稳定纯策略。 如果 T 和 S 中存在随机因 素,是两种不同概率的策略组合时,策略 S 是演化稳 定混合策略。 演化稳定策略是演化博弈的静态均衡,根据建 立的网络信息传播群体的演化博弈模型,结合定义 2 进行模型演化稳定策略的分析,具体过程如下。 1)分析发送真实信息的策略是否是 ESS,即判 断以 x 占比发送失真信息的群体入侵以 1 - x 占比 发送真实信息的群体时,期望收益 E(s1 ) 是否大于 期望收益 E(s2 ) 、 E(s1 ) 和 E(s2 ) 如式 5 所示。 ·490· 智 能 系 统 学 报 第 11 卷
第4期 郭艳燕,等:基于演化博弈论的网络信息传播群体行为分析 ·491· E(s,)=(1-x)·A+x·A 什均衡,因此结合性质1来验证以概率p=(2A- E(s2)=(1-x)·B+x·B/2 (5) B)/B发送真实信息以概率1-p发送失真信息的混 如果E(s1)>E(s2),则需要满足条件x> 合策略是否是弱演化稳定策略,验证过程如下: 2(B-A)/B,如果不满足该条件,即x<2(B- 验证1建立的演化博弈模型不存在强演化稳 A)/B,则E(s1)<E(s2),因此群体发送真实信息 定策略。 的策略不是ESS。 从3.1小节可获知,以概率p=(2A-B)/B发 2)分析发送失真信息的策略是否是ESS,即判 送真实信息,以概率1~p发送失真信息是混合策略 断以x占比发送真实信息的群体来入侵以1-x占 纳什均衡,并且是对称混合纳什均衡。因为在p< 比发送失真信息的群体时,期望收益E(s2)是否大 (2A-B)/B或p>(2A-B)/B时,会得到F(P,P) 于期望收益E(s1),E(s2)和E(s1)如式6所示。 和F(q,P)相反的比较结果。此结果也验证了如果 E(s2)=x·B+(1-x)·B/2 演化稳定策略不是纯策略,那混合策略只可能是弱 E(s1)=x·A+(1-x)·A (6) 演化稳定策略。 如果E(s2)>E(s,),则需要满足条件x> 验证2混合纳什均衡策略是否是演化博弈模 (2A-B)/B,如果不满足该条件,即x< 型的弱演化稳定策略。 (2A-B)/B,则E(s2)<E(s1),因此群体发送失 当p=(2A-B)/B时,g无论为何值时,都存在 真信息的策略不是ESS。 式8和式9结果。 3)分析混合策略是否是ESS F(P,P)=F((2A-B)/B,(2A-B)/B)=A 1-x占比的群体以p概率发送真实信息,以 F(q.p)=F(q,(2A-B)/B)=A= 1-p概率发送失真信息。x占比的群体以q概率 F(p,p)=F(q,p) (q≠P)发送真实信息,以1-g概率发送失真信息 (8) 来入侵。如果采取混合策略p的期望收益大于采取 [F(p,9)=pgA+p(1-q)A+(1-p)gB+ 混合策略g的期望收益,即E(p)>E(g)时,则p是 (1-p)(1-q)B/2 演化稳定混合策略。 F(q,9)=99A+(1-q)qB+q(1-q)A+ 用F(p,q)表示采取策略p的个体Agent与采 (1-q)(1-q)B/2 取策略g的个体Agent交互时,采取p策略的个体 F(p,q)-F(q,9)=(p-q)2B/2>0→ Agent的期望收益。采取p和g策略的期望收益计 F(p,q)F(q.q) 算过程如式7所示。 (9) F(p,q)=pqA +p(1-q)A 因此p=(2A-B)/B是弱演化稳定策略。 (1-p)qB+(1-p)(1-q)B/2 对于给出的演化博弈模型来说,不存在演化稳 F(p,p)=ppA p(1 p)A 定纯策略,但存在演化稳定混合策略,即群体中的个 (1-p)pB+(1-p)(1-p)B/2 体对于已经拥有的信息,采用p=(2A-B)/B概率 F(q,p)=pqA+(1-p)qA+ 发送真实信息以1-p概率发送失真信息的混合策 p(1-q)B+(1-p)(1-q)B/2 (7) 略,会在整个网络信息传播的大环境中生存并稳定 F(9,9)=q9A+(1-q)qB+ 下去。通过演化稳定策略可以来预测在网络信息传 q(1-9)A+(1-q)(1-q)B/2 播中,最终群体传播者的行为策略。 E(p)=(1-x)F(p,p)+xF(p,q) 3.3复制者动态分析 E(q)=(1-x)F(q,P)+xF(q,9) 演化稳定策略属于静态的均衡概念,但无法刻 性质1对所有的q≠p来说,如果E(p)> 画群体行为的动态演化过程,动态的稳定均衡与具 E(q),则p策略是演化稳定策略,需要满足以下两 体的演化过程有关,以下通过复制者动态来描述群 个条件之一[: 体行为的选择过程,从而分析均衡的动态稳定性。 1)F(p,P)>F(q,P),则采取p策略是强演化 在网络信息传播群体中,群体中采取发送真实 稳定策略; 信息策略的比例为x,发送失真信息策略的比例为 2)F(p,P)=F(q,P)且F(p,9)>F(q,q),则 1-x。发送真实信息群体的收益为U1,发送失真信 采取p策略是弱演化稳定策略。 息群体的收益为U2,U表示发送信息群体的平均收 从3.1节可知,静态博弈模型存在对称混合纳 益,如式(10)所示。不同行为群体的收益随比例x
E(s1 ) = (1 - x)·A + x·A E(s2 ) = (1 - x)·B + x·B/ 2 (5) 如果 E(s1 ) > E(s2 ) ,则需要满足条件 x > 2(B -A) / B ,如果不满足该条件,即 x < 2(B - A) / B ,则 E(s1 ) < E(s2 ) ,因此群体发送真实信息 的策略不是 ESS。 2)分析发送失真信息的策略是否是 ESS,即判 断以 x 占比发送真实信息的群体来入侵以 1 - x 占 比发送失真信息的群体时,期望收益 E(s2 ) 是否大 于期望收益 E(s1 ) , E(s2 ) 和 E(s1 ) 如式 6 所示。 E(s2 ) = x·B + (1 - x)·B/ 2 E(s1 ) = x·A + (1 - x)·A (6) 如果 E(s2 ) > E(s1 ) ,则需要满足条件 x > ( 2A -B) / B , 如 果 不 满 足 该 条 件, 即 x < (2A -B) / B ,则 E(s2 ) < E(s1 ) ,因此群体发送失 真信息的策略不是 ESS。 3)分析混合策略是否是 ESS 1 - x 占比的群体以 p 概率发送真实信息,以 1 -p 概率发送失真信息。 x 占比的群体以 q 概率 (q ≠p) 发送真实信息,以 1 - q 概率发送失真信息 来入侵。 如果采取混合策略 p 的期望收益大于采取 混合策略 q 的期望收益,即 E(p) > E(q) 时,则 p 是 演化稳定混合策略。 用 F(p,q) 表示采取策略 p 的个体 Agent 与采 取策略 q 的个体 Agent 交互时,采取 p 策略的个体 Agent 的期望收益。 采取 p 和 q 策略的期望收益计 算过程如式 7 所示。 F(p,q) = pqA + p(1 - q)A + (1 - p)qB + (1 - p)(1 - q)B/ 2 F(p,p) = ppA + p(1 - p)A + (1 - p)pB + (1 - p)(1 - p)B/ 2 F(q,p) = pqA + (1 - p)qA + p(1 - q)B + (1 - p)(1 - q)B/ 2 F(q,q) = qqA + (1 - q)qB + q(1 - q)A + (1 - q)(1 - q)B/ 2 E(p) = (1 - x)F(p,p) + xF(p,q) E(q) = (1 - x)F(q,p) + xF(q,q) ì î í ï ï ï ï ï ï ï ï ï ï ï ï ï ï (7) 性质 1 对所有的 q ≠ p 来说,如果 E(p) > E(q) ,则 p 策略是演化稳定策略,需要满足以下两 个条件之一[9] : 1) F(p,p) > F(q,p) ,则采取 p 策略是强演化 稳定策略; 2) F(p,p) = F(q,p) 且 F(p,q) > F(q,q) ,则 采取 p 策略是弱演化稳定策略。 从 3.1 节可知,静态博弈模型存在对称混合纳 什均衡,因此结合性质 1 来验证以概率 p = (2A - B) / B 发送真实信息以概率 1 - p 发送失真信息的混 合策略是否是弱演化稳定策略,验证过程如下: 验证 1 建立的演化博弈模型不存在强演化稳 定策略。 从 3.1 小节可获知,以概率 p = (2A - B) / B 发 送真实信息,以概率 1 - p 发送失真信息是混合策略 纳什均衡,并且是对称混合纳什均衡。 因为在 p < (2A - B) / B 或 p > (2A - B) / B 时,会得到 F(p,p) 和 F(q,p) 相反的比较结果。 此结果也验证了如果 演化稳定策略不是纯策略,那混合策略只可能是弱 演化稳定策略。 验证 2 混合纳什均衡策略是否是演化博弈模 型的弱演化稳定策略。 当 p = (2A - B) / B 时, q 无论为何值时,都存在 式 8 和式 9 结果。 F(p,p) = F((2A - B) / B,(2A - B) / B) = A F(q,p) = F(q,(2A - B) / B) = A⇒ F(p,p) = F(q,p) ì î í ïï ïï (8) F(p,q) = pqA + p(1 - q)A + (1 - p)qB + (1 - p)(1 - q)B/ 2 F(q,q) = qqA + (1 - q)qB + q(1 - q)A + (1 - q)(1 - q)B/ 2 F(p,q) - F(q,q) = (p - q)2B/ 2 > 0⇒ F(p,q) > F(q,q) ì î í ï ï ï ï ï ï ï ï (9) 因此 p = (2A - B) / B 是弱演化稳定策略。 对于给出的演化博弈模型来说,不存在演化稳 定纯策略,但存在演化稳定混合策略,即群体中的个 体对于已经拥有的信息,采用 p = (2A - B) / B 概率 发送真实信息以 1 - p 概率发送失真信息的混合策 略,会在整个网络信息传播的大环境中生存并稳定 下去。 通过演化稳定策略可以来预测在网络信息传 播中,最终群体传播者的行为策略。 3.3 复制者动态分析 演化稳定策略属于静态的均衡概念,但无法刻 画群体行为的动态演化过程,动态的稳定均衡与具 体的演化过程有关,以下通过复制者动态来描述群 体行为的选择过程,从而分析均衡的动态稳定性。 在网络信息传播群体中,群体中采取发送真实 信息策略的比例为 x ,发送失真信息策略的比例为 1 - x 。 发送真实信息群体的收益为 U1 ,发送失真信 息群体的收益为 U2 , U 表示发送信息群体的平均收 益,如式(10)所示。 不同行为群体的收益随比例 x 第 4 期 郭艳燕,等:基于演化博弈论的网络信息传播群体行为分析 ·491·