第15卷第5期 智能系统学报 Vol.15 No.5 2020年9月 CAAI Transactions on Intelligent Systems Sep.2020 D0:10.11992/tis.201903011 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20191015.1155.002.html 基于两级传播理论的舆论超网络传播分析 熊尧',李弼程,王子玥 (1.华侨大学计算机科学与技术学院,福建厦门361021;2.美亚柏科信息股份有限公司,福建厦门361021) 摘要:社交网络挖掘可以使人们更好地认识信息在网络中的传播规律,分析信息在事件中的传播特点。现有 的文献研究主要集中于舆论事件社交网络的静态建模,以及针对一些共性特点的仿真验证,而对舆论事件模型 结构变化的讨论较少。本文尝试从两级传播理论出发,采用三层超网络结构对舆论事件不同时段构建传播分 析模型,给出舆论演化分析度量指标,挖掘超网络结构变化的特点,探索舆论酝酿期积蓄力量的潜在因素。以 长生疫苗事件进行分析,发现需要在酝酿期有多样化的意见领袖不断在各个话题中进行牵引,在积累了潜在的 舆论人群之后才能促成舆论爆发。 关键词:社交网络;两级传播理论;超网络:演化分析:动力学;舆论酝酿期:网络结构度量;话题牵引 中图分类号:N949,TP18文献标志码:A文章编号:1673-4785(2020)05-0870-10 中文引用格式:熊尧,李弼程,王子玥.基于两级传播理论的與论超网络传播分析.智能系统学报,2020,15(5):870-879. 英文引用格式:XIONG Yao,.LI Bicheng,WANG Ziyue.Analysis of public opinions in network communication based on the two. level communication theoryJ CAAI transactions on intelligent systems,2020,15(5):870-879. Analysis of public opinions in network communication based on the two-level communication theory XIONG Yao',LI Bicheng',WANG Ziyue? (1.College of Computer Science and Technology,Huaqiao University,Xiamen 361021,China;2.Meiya Pico Information Co.,Ltd., Xiamen 361021,China) Abstract:Social network mining can help people better understand the law of information dissemination and analyze the characteristics of information dissemination in events.Existing literature primarily focus on static modeling of pub- lic opinion in social network and simulation verification for some common characteristics and giving less importance to discussions on the structural change of public opinion based on events.This paper attempts to use the two-stage commu- nication theory to construct communication analysis model for different periods (events)of public opinion based on a three-layer super-network structure.Indexes of public opinion in social network are measured by evolution analysis,the characteristics of super network structure change are uncovered,and potential factors of public opinions accumulated strength during the gestation period are explored.Taking Changsheng vaccine's incident as an example for analysis,this paper finds that during the incubation period,diversified opinion leaders are needed to constantly feed on various topics and gather or combine potential public opinion groups before leading to the upsurge of public opinion. Keywords:social network;two-stage communication theory;super-network;evolution analysis;dynamics; public opinions'brewing period;network structure measurement;topic traction 互联网快捷的信息获取渠道、便利的意见表 收稿日期:2019-03-12.网络出版日期:2019-10-15. 基金项目:国家社会科学基金项目(19BXWI10):福建省社会科 达方式以及日益完善的信息交互平台,使得网络 学规划项目(F2017B073:华侨大学研究生科研创 新基金项目. 舆论逐渐成为日常舆情集中体现的地点。当个人 通信作者:李弼程.E-mail:Ibelm@163.com 的声音能够被传播给更多的人,其本质上就构成
DOI: 10.11992/tis.201903011 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20191015.1155.002.html 基于两级传播理论的舆论超网络传播分析 熊尧1 ,李弼程1 ,王子玥2 (1. 华侨大学 计算机科学与技术学院,福建 厦门 361021; 2. 美亚柏科信息股份有限公司,福建 厦门 361021) 摘 要:社交网络挖掘可以使人们更好地认识信息在网络中的传播规律,分析信息在事件中的传播特点。现有 的文献研究主要集中于舆论事件社交网络的静态建模,以及针对一些共性特点的仿真验证,而对舆论事件模型 结构变化的讨论较少。本文尝试从两级传播理论出发,采用三层超网络结构对舆论事件不同时段构建传播分 析模型,给出舆论演化分析度量指标,挖掘超网络结构变化的特点,探索舆论酝酿期积蓄力量的潜在因素。以 长生疫苗事件进行分析,发现需要在酝酿期有多样化的意见领袖不断在各个话题中进行牵引,在积累了潜在的 舆论人群之后才能促成舆论爆发。 关键词:社交网络;两级传播理论;超网络;演化分析;动力学;舆论酝酿期;网络结构度量;话题牵引 中图分类号:N949;TP18 文献标志码:A 文章编号:1673−4785(2020)05−0870−10 中文引用格式:熊尧, 李弼程, 王子玥. 基于两级传播理论的舆论超网络传播分析 [J]. 智能系统学报, 2020, 15(5): 870–879. 英文引用格式:XIONG Yao, LI Bicheng, WANG Ziyue. Analysis of public opinions in network communication based on the twolevel communication theory[J]. CAAI transactions on intelligent systems, 2020, 15(5): 870–879. Analysis of public opinions in network communication based on the two-level communication theory XIONG Yao1 ,LI Bicheng1 ,WANG Ziyue2 (1. College of Computer Science and Technology, Huaqiao University, Xiamen 361021, China; 2. Meiya Pico Information Co., Ltd., Xiamen 361021, China) Abstract: Social network mining can help people better understand the law of information dissemination and analyze the characteristics of information dissemination in events. Existing literature primarily focus on static modeling of public opinion in social network and simulation verification for some common characteristics and giving less importance to discussions on the structural change of public opinion based on events. This paper attempts to use the two-stage communication theory to construct communication analysis model for different periods (events) of public opinion based on a three-layer super-network structure. Indexes of public opinion in social network are measured by evolution analysis, the characteristics of super network structure change are uncovered, and potential factors of public opinions accumulated strength during the gestation period are explored. Taking Changsheng vaccine’s incident as an example for analysis, this paper finds that during the incubation period, diversified opinion leaders are needed to constantly feed on various topics and gather or combine potential public opinion groups before leading to the upsurge of public opinion. Keywords: social network; two-stage communication theory; super-network; evolution analysis; dynamics; public opinions’ brewing period; network structure measurement; topic traction 互联网快捷的信息获取渠道、便利的意见表 达方式以及日益完善的信息交互平台,使得网络 舆论逐渐成为日常舆情集中体现的地点。当个人 的声音能够被传播给更多的人,其本质上就构成 收稿日期:2019−03−12. 网络出版日期:2019−10−15. 基金项目:国家社会科学基金项目 (19BXW110);福建省社会科 学规划项目 (FJ2017B073);华侨大学研究生科研创 新基金项目. 通信作者:李弼程. E-mail:lbclm@163.com. 第 15 卷第 5 期 智 能 系 统 学 报 Vol.15 No.5 2020 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2020
第5期 熊尧,等:基于两级传播理论的舆论超网络传播分析 ·871· 了互联网平台对一般公民的赋权,传播权利的再 律,如沈乾等构造了线上线下两层超网络并定 分配打破了传统舆论主流媒体意见的垄断"。在 义了交互规则,讨论了线上线下的舆论传播区 这样一种舆论结构中,政府和媒体掌握着信息和 别;马宁等1设置了四层超网络,对舆论场的外 资本的优势,而民众具有着数量表达的优势。然 驱动力和内驱动力进行了整体建模,并通过对实 而依托互联网平台具有了对等权力的网民群体, 际案例抽象出的参数进行了超网络仿真,分析了 其成熟水平却不能和政府及媒体相提并论,或者 事件不同阶段的特点;wang等i给出了基于微 说网民的意见表达往往摻杂有较多感性成分,更 信社交网络增长模式的超边增长和消亡仿真规 愿意相信自身情绪的直觉,而这也给了舆论走向 则。基于超网络的度量分析主要是指对社交网络 较多的负向压力。 构造出的静态超网络的拓扑性质的研究,如利用 由于传播结构的转变,驱动舆论的动力学特 超网络的结构度量指标来寻找潜在的意见领袖可 征也在发生着变化,互联网舆论从不缺乏讨论者 或是采用适当的迭代算法发现社团结构:也 的参与,也使得互联网舆论有“景观化”的倾向。 有研究网络结构变化的预测问题,如Kapoor等o 在奥论彻底爆发之前,往往潜藏着很多的“观景 在研究点中心性过程中对超边赋权从而更好地预 者”。同时,网络舆论中网民也可以成为议题设置 测超边变化对社交网络带来的影响以及Zhang等四 的主体,网民的意见往往和媒体、政府公布的信 提出社会学理论来预测链路的变化。 息交叉存在,而不再存在绝对的先后因果关系。 对超网络度量分析的研究可以更好地帮助人 分析网络舆论演化的动力学特征,能够更好地掌 们认识社交网络结构及内在特点,例如将社交网 控舆论发展的阶段变化规律,理清舆论演化中潜 络抽象为观点层、心理层等层次可以完整地刻画 在的主要动力因素和次要动力因素,帮助政府和 网络舆论中个体发表观点的历程。但在真实社交 媒体在互联网平台中发布恰当的信息应对舆论态 网络环境中,一些抽象信息如用户心理和所处社 势的发展。 会环境等是较难获取的,也就带来了对事件建模 早期的舆论演化建模主要是基于传播学衍生 的困难。另一方面,现有研究的分析多是基于静 的复杂网络模型,如元胞自动机、Galam模型、 态网络的度量,不适用于网络动态演化。如果要 SIR模型等。这当中以胡晓峰教授等为代表进 进行动态结构上的分析,则需要在原有概念上做 行了许多相关研究,如文献[采用WS小世界模 新的扩展。本文利用已有研究中的多层超网络结 型通过仿真来验证社会学规律:利用多智能体系 构,同时借鉴社交网络动态仿真的思想,利用不 统仿真来观察网民在相互交流中的观点态度的变 同时刻下不同结构的社交超网络刻画舆论变化, 化⑧:贺筱媛等利用仿真探究了各种传播途径 从而更深人地发现舆论的动力机理。 的差异。李春发等1o基于bass模型结合多智能 1超网络概念 体仿真讨论了政府干预对民众态度的影响。刘锦 德等u也采用了小世界网络并结合deffaunt模型 Berge最早给出了超网络这一概念a,是基于 设定观点交互规则来“对比”模型中各参数对民众 超图的超网络,此外还有基于网络的超网络形式。 态度变化的影响。在早期的社交网络分析中,以 本文采用的超网络结构为基于超图的超网络,其 复杂网络模型为基础讨论的内容主要集中在环境 特点在于具有多层结构,层间和层内均可具有连 参数的影响及网络传播的仿真效果上,这有助于 接,层内节点为同质节点,层间为异质节点,相互 我们认识社交网络中存在的一些规律,但复杂网 之间的连接反映的是社交环境中的复杂关系。 络抽象出的真实社交网络的特点往往是局部的、 超图的定义为,设V={w1,2,…,y}是一个有 不完整的,因此有了由复杂网络向超网络模型转变。 限集。若 超网络模型摒弃了复杂网络的单一层级结 1)e:≠0(i=1,2,…,m) 构,将社交网络中不同性质的信息化为异质节点 2)UMe:=V 存放于不同层的网络中,可以灵活地表示社交网 则称二元关系H=(VE)为一个超图。V的元素 络中的多样化信息。现有文献中对于超网络的应 y1,2,…,vn称为超图的顶点,n表示顶点的数量, 用主要有两方面:1)基于超网络的仿真模拟, E={e1,e2,…,em}是超图边的集合,m表示边的数量, 2)利用各种度量指标在超网络上进行舆论建模度 集合e={,2,…,l(i=1,2,…,m称为超图的边。 量分析2。仿真方向上主要讨论的是利用超网 超网络的数学表达式记为 络结构结合动力学特征观察社交网络的演变及规 G=(VH) (1)
了互联网平台对一般公民的赋权,传播权利的再 分配打破了传统舆论主流媒体意见的垄断[1]。在 这样一种舆论结构中,政府和媒体掌握着信息和 资本的优势,而民众具有着数量表达的优势。然 而依托互联网平台具有了对等权力的网民群体, 其成熟水平却不能和政府及媒体相提并论,或者 说网民的意见表达往往掺杂有较多感性成分,更 愿意相信自身情绪的直觉,而这也给了舆论走向 较多的负向压力[2]。 由于传播结构的转变,驱动舆论的动力学特 征也在发生着变化,互联网舆论从不缺乏讨论者 的参与,也使得互联网舆论有“景观化”的倾向[3]。 在舆论彻底爆发之前,往往潜藏着很多的“观景 者”。同时,网络舆论中网民也可以成为议题设置 的主体,网民的意见往往和媒体、政府公布的信 息交叉存在,而不再存在绝对的先后因果关系。 分析网络舆论演化的动力学特征,能够更好地掌 控舆论发展的阶段变化规律,理清舆论演化中潜 在的主要动力因素和次要动力因素,帮助政府和 媒体在互联网平台中发布恰当的信息应对舆论态 势的发展。 早期的舆论演化建模主要是基于传播学衍生 的复杂网络模型,如元胞自动机[4] 、Galam 模型[5] 、 SIR 模型[6] 等。这当中以胡晓峰教授等为代表进 行了许多相关研究,如文献 [7] 采用 WS 小世界模 型通过仿真来验证社会学规律;利用多智能体系 统仿真来观察网民在相互交流中的观点态度的变 化 [8] ;贺筱媛等[9] 利用仿真探究了各种传播途径 的差异。李春发等[10] 基于 bass 模型结合多智能 体仿真讨论了政府干预对民众态度的影响。刘锦 德等[11] 也采用了小世界网络并结合 deffaunt 模型 设定观点交互规则来“对比”模型中各参数对民众 态度变化的影响。在早期的社交网络分析中,以 复杂网络模型为基础讨论的内容主要集中在环境 参数的影响及网络传播的仿真效果上,这有助于 我们认识社交网络中存在的一些规律,但复杂网 络抽象出的真实社交网络的特点往往是局部的、 不完整的,因此有了由复杂网络向超网络模型转变。 超网络模型摒弃了复杂网络的单一层级结 构,将社交网络中不同性质的信息化为异质节点 存放于不同层的网络中,可以灵活地表示社交网 络中的多样化信息。现有文献中对于超网络的应 用主要有两方面: 1) 基于超网络的仿真模拟, 2) 利用各种度量指标在超网络上进行舆论建模度 量分析[12-13]。仿真方向上主要讨论的是利用超网 络结构结合动力学特征观察社交网络的演变及规 律,如沈乾等[14] 构造了线上线下两层超网络并定 义了交互规则,讨论了线上线下的舆论传播区 别;马宁等[15] 设置了四层超网络,对舆论场的外 驱动力和内驱动力进行了整体建模,并通过对实 际案例抽象出的参数进行了超网络仿真,分析了 事件不同阶段的特点;Wang 等 [16] 给出了基于微 信社交网络增长模式的超边增长和消亡仿真规 则。基于超网络的度量分析主要是指对社交网络 构造出的静态超网络的拓扑性质的研究,如利用 超网络的结构度量指标来寻找潜在的意见领袖[17] 或是采用适当的迭代算法发现社团结构[18-19] ;也 有研究网络结构变化的预测问题,如 Kapoor 等 [20] 在研究点中心性过程中对超边赋权从而更好地预 测超边变化对社交网络带来的影响以及 Zhang 等 [21] 提出社会学理论来预测链路的变化。 对超网络度量分析的研究可以更好地帮助人 们认识社交网络结构及内在特点,例如将社交网 络抽象为观点层、心理层等层次可以完整地刻画 网络舆论中个体发表观点的历程。但在真实社交 网络环境中,一些抽象信息如用户心理和所处社 会环境等是较难获取的,也就带来了对事件建模 的困难。另一方面,现有研究的分析多是基于静 态网络的度量,不适用于网络动态演化。如果要 进行动态结构上的分析,则需要在原有概念上做 新的扩展。本文利用已有研究中的多层超网络结 构,同时借鉴社交网络动态仿真的思想,利用不 同时刻下不同结构的社交超网络刻画舆论变化, 从而更深入地发现舆论的动力机理。 1 超网络概念 Berge 最早给出了超网络这一概念[22] ,是基于 超图的超网络,此外还有基于网络的超网络形式[23]。 本文采用的超网络结构为基于超图的超网络,其 特点在于具有多层结构,层间和层内均可具有连 接,层内节点为同质节点,层间为异质节点,相互 之间的连接反映的是社交环境中的复杂关系。 超图的定义为,设 V = {v1, v2,··· , vn} 是一个有 限集。若 1) ei , Ø(i = 1,2,··· ,m) U m i=1 2) ei = V H = (V,E) v1, v2,··· , vn E = {e1, e2,··· , em} ei = { vi1, vi2,··· , vi j} (i = 1,2,··· ,m) 则称二元关系 为一个超图。V 的元素 称为超图的顶点,n 表示顶点的数量, 是超图边的集合,m 表示边的数量, 集合 称为超图的边。 超网络的数学表达式记为 G = (V,H) (1) 第 5 期 熊尧,等:基于两级传播理论的舆论超网络传播分析 ·871·
·872· 智能系统学报 第15卷 V和H的表达式如下 V={V,i=1,2,…,NVnV≠01 (2) 观点层 H={1,y2,…,vw)weV,i=1,2,…,N(3) 式中V代表超网络G中所有节点的集合。以三 生成 层超网络为例,V、V,、V分别表示三层中的节点 集合,H表示超边的集合,(",y,)表示的是一条 意见领袖层 超边中的3个顶点,任何一个超边由相连的多个 不同质节点构成。由上面超图和超网络的定义可 加工 以看出,超网络是超图的一种特殊形式。 信息层 由此衍生出的均匀超网络表示的是构成超网 络中的超边节点数相同,其条件相比于超网络更 图1三层超网络结构 强,且由于超边节点均匀,使得图中的计量更容 Fig.1 Three-layer supernetwork architecture diagram 易进行。采用超网络结构来分析舆论事件的变化 信息层表示的是原始新闻包含的关键信息。 主要具有以下几个优点: 文献[26]指出,舆论治理的主要成分之一是舆论 1)超网络结构可以将舆论的多维信息转化为 的客体。因此,在信息层,主要包含当前舆论事 种立体结构,层内同质、层间异质、多层互联、 件的客体目标信息,其层内潜在连接表示客体目 关系脱离语义的特点,使其更易于进行纯数学上 标间的关系。 的结构计算和分析。 在意见领袖层中,节点表示的是当前舆论环 2)将真实数据化为超网络中的超边,通过统 境下出现的意见领袖,其对原始信息进行再加 计不同时刻下的超边变化的规律可以更容易发现 工,形成新的信息结构,经过打包再推送至一般 舆论的动力学特征,并且这种特征是直观的,可 受众。意见领袖层向下连接信息源层,表示再加 复现的。 工的过程:向上呈递信息给观点层,表示由意见 3)在建模后,即使有新的数据和完全不同的 领袖引发的观点表达;其层内连接表示不同意见 内容加入,也可以通过增加层次和连接来对原有 领袖的关系紧密程度。舆论场中的社会环境信息 超网络进行更新,即超网络也是易于扩展的。 及网民自身心理信息隐藏于由意见领袖层到观点 2基于两级传播理论的超网络结构 层的表达中。 在观点层中,体现的是一般网民在浏览、转 2.1三层超网络结构 载,或潜在受到某些意见领袖发布信息的影响后 在真实的社交网络环境中,一般用户接触到 表达的自身观点,其层内连接表示观点的相似水 的信息通常是多种多样的,仅对社交关系拓扑进 平。由于普通网民之间的交互非常庞杂不宜度 行建模,或仅观测信息的流动都不足以整合复杂 量,因此,将意见领袖层直接对接观点层来表现 的多源信息。根据两级传播理论,信息流动的方 最终由普通网民形成的舆论,这样更有助于捕捉 向通常是由舆论领袖对原始信息进行再加工后再 全局舆论的动态变化以及对超网络进行结构分析。 传播给一般受众2,而且网民表达的观点也常常 2.2动力学探索 衍生于舆论领袖所发布的信息,有时更是直接引 基于两级传播理论的超网络模型不仅可以方 用舆论领袖发布的信息来代表自己的观点。由此 便地进行图挖掘,而且可以通过不同的度量指标 我们认为真实的舆论场通常是:官方发布的当前 从不同维度刻画当前超网络结构。通过对真实数 舆论事件主要报道构成信息源;舆论领袖对这些 据的分析,尤其是演化过程中对超网络模型的多 信息进行加工和补充,使其变为大众可以理解和 种度量,可以不断完善对社会舆论的动力学因素 接受的内容;大众阅读意见领袖再加工的信息之 的探索,以使得仿真模拟过程更加完善。反过 后在社交平台表达自己的观点。这和二级传播理 来,仿真模拟过程中出现的和现实不符的部分, 论也是相吻合的2。由此,舆论场的主要要素就 也可以为真实数据搭建的超网络分析提供研究方向。 由三部分构成,分别是原始信息、意见领袖传播、 超网络的演化中,超边增长及变化模式是核 群众观点。将此三部分分别作为超网络层次即可 心要素,也是舆论演化仿真的重要内容可。由于 构建本文所采用的超网络结构,其在舆论场中的 超边的增长、消退、相互之间连接的变化等在超 作用机理如图1所示。 网络模型中都直接代表了舆论随时间的演进过
V 和 H 的表达式如下 V = { Vi ,i = 1,2,··· ,N|Vi ∩Vj , Ø } (2) H = {(v1, v2,··· , vN)|vi ∈ Vi ,i = 1,2,··· ,N} (3) Vα Vt Vk (vα, vt , vk) 式中 V 代表超网络 G 中所有节点的集合。以三 层超网络为例, 、 、 分别表示三层中的节点 集合,H 表示超边的集合, 表示的是一条 超边中的 3 个顶点,任何一个超边由相连的多个 不同质节点构成。由上面超图和超网络的定义可 以看出,超网络是超图的一种特殊形式。 由此衍生出的均匀超网络表示的是构成超网 络中的超边节点数相同,其条件相比于超网络更 强,且由于超边节点均匀,使得图中的计量更容 易进行。采用超网络结构来分析舆论事件的变化 主要具有以下几个优点: 1) 超网络结构可以将舆论的多维信息转化为 一种立体结构,层内同质、层间异质、多层互联、 关系脱离语义的特点,使其更易于进行纯数学上 的结构计算和分析。 2) 将真实数据化为超网络中的超边,通过统 计不同时刻下的超边变化的规律可以更容易发现 舆论的动力学特征,并且这种特征是直观的,可 复现的。 3) 在建模后,即使有新的数据和完全不同的 内容加入,也可以通过增加层次和连接来对原有 超网络进行更新,即超网络也是易于扩展的。 2 基于两级传播理论的超网络结构 2.1 三层超网络结构 在真实的社交网络环境中,一般用户接触到 的信息通常是多种多样的,仅对社交关系拓扑进 行建模,或仅观测信息的流动都不足以整合复杂 的多源信息。根据两级传播理论,信息流动的方 向通常是由舆论领袖对原始信息进行再加工后再 传播给一般受众[24] ,而且网民表达的观点也常常 衍生于舆论领袖所发布的信息,有时更是直接引 用舆论领袖发布的信息来代表自己的观点。由此 我们认为真实的舆论场通常是:官方发布的当前 舆论事件主要报道构成信息源;舆论领袖对这些 信息进行加工和补充,使其变为大众可以理解和 接受的内容;大众阅读意见领袖再加工的信息之 后在社交平台表达自己的观点。这和二级传播理 论也是相吻合的[25]。由此,舆论场的主要要素就 由三部分构成,分别是原始信息、意见领袖传播、 群众观点。将此三部分分别作为超网络层次即可 构建本文所采用的超网络结构,其在舆论场中的 作用机理如图 1 所示。 观点层 意见领袖层 信息层 生成 加工 图 1 三层超网络结构 Fig. 1 Three-layer supernetwork architecture diagram 信息层表示的是原始新闻包含的关键信息。 文献 [26] 指出,舆论治理的主要成分之一是舆论 的客体。因此,在信息层,主要包含当前舆论事 件的客体目标信息,其层内潜在连接表示客体目 标间的关系。 在意见领袖层中,节点表示的是当前舆论环 境下出现的意见领袖,其对原始信息进行再加 工,形成新的信息结构,经过打包再推送至一般 受众。意见领袖层向下连接信息源层,表示再加 工的过程;向上呈递信息给观点层,表示由意见 领袖引发的观点表达;其层内连接表示不同意见 领袖的关系紧密程度。舆论场中的社会环境信息 及网民自身心理信息隐藏于由意见领袖层到观点 层的表达中。 在观点层中,体现的是一般网民在浏览、转 载,或潜在受到某些意见领袖发布信息的影响后 表达的自身观点,其层内连接表示观点的相似水 平。由于普通网民之间的交互非常庞杂不宜度 量,因此,将意见领袖层直接对接观点层来表现 最终由普通网民形成的舆论,这样更有助于捕捉 全局舆论的动态变化以及对超网络进行结构分析。 2.2 动力学探索 基于两级传播理论的超网络模型不仅可以方 便地进行图挖掘,而且可以通过不同的度量指标 从不同维度刻画当前超网络结构。通过对真实数 据的分析,尤其是演化过程中对超网络模型的多 种度量,可以不断完善对社会舆论的动力学因素 的探索,以使得仿真模拟过程更加完善。反过 来,仿真模拟过程中出现的和现实不符的部分, 也可以为真实数据搭建的超网络分析提供研究方向。 超网络的演化中,超边增长及变化模式是核 心要素,也是舆论演化仿真的重要内容[27]。由于 超边的增长、消退、相互之间连接的变化等在超 网络模型中都直接代表了舆论随时间的演进过 ·872· 智 能 系 统 学 报 第 15 卷
第5期 熊尧,等:基于两级传播理论的舆论超网络传播分析 ·873· 程,因此超边在舆论事件中变化的动力学因素是 别属于(v2,V2,a),(w2,2,y2),(v2,m,y2)3条不同 仿真建模好坏的关键。一般舆论的发展可分为酝 的超边。由于同层节点不能构成超边,故超三角 酿期、爆发期、消退期,驱动舆论演化的关键在 形仅存在于不同层节点构成的边中,在计算超边 于酝酿期和爆发期。我们关心的也是在舆论演化的 数目时,先统计所有不重复的超边,然后将这些 前中期,驱动着舆论继续变化的潜在的动力学因素。 超边中的两两节点与全部的超边中的对应节点做 我们尝试以超网络模型作为基础,通过多种 对比,当任意两节点组合都存在超边与之对应则 度量指标探索舆论前中期超边增长的驱动因素。 构成超三角形,依次遍历统计出超三角形数目。 1)在真实数据中,酝酿期和消退期的超边在度量 在本文中的超网络结构下,中间层代表着传播信 指标的计算下有何区别,在前期由超边链接计算 息的“领袖”节点,上层代表观点,下层代表舆论 出的演化指数是如何关联到中期的舆论爆发的。 原始信息。 2)在超边增长过程中意见领袖在其中的驱动作 3.2集聚系数 用,舆论的传播和爆发离不开意见领袖,但不同 集聚系数是基于超三角形概念提出的一种度 的意见领袖相互之间如何配合参与进舆论的传播 量指标,超网络中集聚系数定义四为 过程更有可能推动舆论的前进并诱发爆发,仍然 C=6×超三角形的个数 值得探讨。 二路的个数 (4) 前面对超三角形和二路给出了定义,现有研 3度量指标 究认为超三角形数量越多,意味着在三层超网络 为了实现在超网络结构上的动力学探索,我 结构中越可能存在意见领袖,即人们的意见很 们将使用一部分超网络度量指标来刻画分析超网 有可能受到了引导和集聚。结合到本文采用的超 络在不同时刻的变化。 网络结构,集聚系数体现的是在当前舆论环境下 3.1超三角形 意见领袖是否对舆论的表达产生着聚集效应,从 超网络的基本单元为超边,在三层超网络中, 对舆论环境的评价角度来看,集聚系数表现出了 超边由3个处于不同层的节点构成,而这样一个 当前舆论场下舆论的聚焦水平或是潜在的热度水平。 超边(w,y,)将其抽象为一个由这3个顶点构成 3.3演化系数 的三角形,任意两点的边都属于这个三角形。在 仅使用集聚系数不足以评估舆论环境在不同 介绍超三角形之前,先说明二路的概念。 时间下超网络结构的变化情况。因此,在超三角 二路指的是由3个不同的顶点和两个不同的 形表达的含义基础上,结合集聚系数的概念提出 超边组成的序列,由图2所示,右侧三层超网络由 演化系数。传统监测方法主要采用相关主题的发 左侧的超边构成,左侧超边为右侧网络的全集。 帖量来评估舆论的热度水平。此处使用一个演化 其中的二路例如(a,2,a),其由3个不同的顶点 系数,用于考量超网络中超边变化带来的信息变 构成,(wa,2)属于(wa2,2,a)超边,(wa,Vs)属于 迁,以此来评估事件演化的剧烈程度,探究舆论 (v2,v2,yg)超边,(v2,a)不属于任何一条超边。 发展过程中的动力学因素,分析舆论的高涨低迷 下相关主题信息内容的变迁特点,这种变迁包括网 民之间讨论的内容,以及自媒体、官媒的发布内容。 (Vat,Va,Vai) (Va.Va,Ve) 假设在不同时间刻度下,超网络都有新的超 (Va,Va:Ve) 三角形和二路出现,旧的超三角形和二路消失。 (V,Vo,Y) 通过集聚系数,可以计算出任一时刻下网络的聚 (Va,Va,Ve) (Vat,Ve,Vua) 焦水平,但在整个舆论事件中我们更关心舆论这 种聚焦状态的变化。这主要关系到两个维度的信 超边集合 息:一是聚焦水平的高低起伏,展现的是舆论在 三层超网络 某一事件上关注度的变化;二是聚焦点的迁移程 度,体现的是不同话题点的转变。若聚焦水平保 图2超三角形示意图 Fig.2 Hypertriangle diagram 持了一定数值,但聚焦点迁移剧烈,说明民众对 超三角形的定义比二路的定义更强,其由 此事依然处于不断关注新信息的状态,仍不稳 3个不同的顶点和3个不同的超边构成的序列, 定;反之聚焦点迁移较小,但聚焦水平高低起伏 且3个顶点相互相邻。在图2中仅存在一个超三 则说明民众意见依然不统一。本文认为要综合考 角形(W2,v2,V2),其中(W2,va,(y2,Va),(v2,2)分 量两方面信息才能够对舆论的演化变迁的剧烈程
程,因此超边在舆论事件中变化的动力学因素是 仿真建模好坏的关键。一般舆论的发展可分为酝 酿期、爆发期、消退期[28] ,驱动舆论演化的关键在 于酝酿期和爆发期。我们关心的也是在舆论演化的 前中期,驱动着舆论继续变化的潜在的动力学因素。 我们尝试以超网络模型作为基础,通过多种 度量指标探索舆论前中期超边增长的驱动因素。 1) 在真实数据中,酝酿期和消退期的超边在度量 指标的计算下有何区别,在前期由超边链接计算 出的演化指数是如何关联到中期的舆论爆发的。 2) 在超边增长过程中意见领袖在其中的驱动作 用,舆论的传播和爆发离不开意见领袖,但不同 的意见领袖相互之间如何配合参与进舆论的传播 过程更有可能推动舆论的前进并诱发爆发,仍然 值得探讨。 3 度量指标 为了实现在超网络结构上的动力学探索,我 们将使用一部分超网络度量指标来刻画分析超网 络在不同时刻的变化。 3.1 超三角形 (vα, vt , vk) 超网络的基本单元为超边,在三层超网络中, 超边由 3 个处于不同层的节点构成,而这样一个 超边 将其抽象为一个由这 3 个顶点构成 的三角形,任意两点的边都属于这个三角形。在 介绍超三角形之前,先说明二路的概念。 (vk2, vt2, vk3) (vk2, vt2) (vα2, vt2, vk2) (vt2, vk3) (vα2, vt2, vk3) (vk2, vk3) 二路指的是由 3 个不同的顶点和两个不同的 超边组成的序列,由图 2 所示,右侧三层超网络由 左侧的超边构成,左侧超边为右侧网络的全集。 其中的二路例如 ,其由 3 个不同的顶点 构成, 属于 超边, 属于 超边, 不属于任何一条超边。 超边集合 三层超网络 (va1 , vt1 , vk1 ) (va2 , vt1 , vk2 ) (va2 , vt2 , vk2 ) (va2 , vt2 , vk3 ) (va3 , vt2 , vk3 ) (va4 , vt2 , vk4 ) va1 va2 va3 va4 vt1 vk1 vk2 vk3 vk4 vt2 图 2 超三角形示意图 Fig. 2 Hypertriangle diagram (vα2, vt2, vk2) (vα2, vt2) (vt2, vk2) (vα2, vk2) 超三角形的定义比二路的定义更强,其由 3 个不同的顶点和 3 个不同的超边构成的序列, 且 3 个顶点相互相邻。在图 2 中仅存在一个超三 角形 ,其中 , , 分 别属于 (vα2, vt2, vk3),(vα2, vt2, vk2),(vα2, vt1, vk2) 3 条不同 的超边。由于同层节点不能构成超边,故超三角 形仅存在于不同层节点构成的边中,在计算超边 数目时,先统计所有不重复的超边,然后将这些 超边中的两两节点与全部的超边中的对应节点做 对比,当任意两节点组合都存在超边与之对应则 构成超三角形,依次遍历统计出超三角形数目。 在本文中的超网络结构下,中间层代表着传播信 息的“领袖”节点,上层代表观点,下层代表舆论 原始信息。 3.2 集聚系数 集聚系数是基于超三角形概念提出的一种度 量指标,超网络中集聚系数定义[22] 为 C = 6×超三角形的个数 二路的个数 (4) 前面对超三角形和二路给出了定义,现有研 究认为超三角形数量越多,意味着在三层超网络 结构中越可能存在意见领袖[29] ,即人们的意见很 有可能受到了引导和集聚。结合到本文采用的超 网络结构,集聚系数体现的是在当前舆论环境下 意见领袖是否对舆论的表达产生着聚集效应,从 对舆论环境的评价角度来看,集聚系数表现出了 当前舆论场下舆论的聚焦水平或是潜在的热度水平。 3.3 演化系数 仅使用集聚系数不足以评估舆论环境在不同 时间下超网络结构的变化情况。因此,在超三角 形表达的含义基础上,结合集聚系数的概念提出 演化系数。传统监测方法主要采用相关主题的发 帖量来评估舆论的热度水平。此处使用一个演化 系数,用于考量超网络中超边变化带来的信息变 迁,以此来评估事件演化的剧烈程度,探究舆论 发展过程中的动力学因素,分析舆论的高涨低迷 下相关主题信息内容的变迁特点,这种变迁包括网 民之间讨论的内容,以及自媒体、官媒的发布内容。 假设在不同时间刻度下,超网络都有新的超 三角形和二路出现,旧的超三角形和二路消失。 通过集聚系数,可以计算出任一时刻下网络的聚 焦水平,但在整个舆论事件中我们更关心舆论这 种聚焦状态的变化。这主要关系到两个维度的信 息:一是聚焦水平的高低起伏,展现的是舆论在 某一事件上关注度的变化;二是聚焦点的迁移程 度,体现的是不同话题点的转变。若聚焦水平保 持了一定数值,但聚焦点迁移剧烈,说明民众对 此事依然处于不断关注新信息的状态,仍不稳 定;反之聚焦点迁移较小,但聚焦水平高低起伏, 则说明民众意见依然不统一。本文认为要综合考 量两方面信息才能够对舆论的演化变迁的剧烈程 第 5 期 熊尧,等:基于两级传播理论的舆论超网络传播分析 ·873·
·874· 智能系统学报 第15卷 度给出判断。 3.4节点超度 结合前面的分析,演化系数的计算式主要由 某个节点的超度定义为该节点参与组成的超 两部分构成:计算聚焦水平和迁移水平。聚焦水 边数目B0。节点的超度为1,当存在1条超边 平可以直接由集聚系数计算得到。本文认为,超三 (,y,)均包含y,。节点超度在具体节点代表不 和二路新旧更替越严重,则迁移水平越高,可以用 同含义时也有着不同的意义。以本文的三层超网 新增加和消失的超三角形总量占总超三角形的比 络为例,意见领袖层的节点超度代表的是该意见 例来衡量;另一方面,集聚系数越高的超网络其 领袖的影响力,超边越多,代表有越多的人通过 同样比例的超三角形变化应该具有更高的迁移水平。 此意见领袖获取信息、发表意见;信息层的节点 以图3为例,记时刻的超三角形集合为S, 超度代表的是该信息点在此次舆论事件中的关注 二路集合为Q,2时刻的超三角形集合为S2,二 水平,表示有更多的民众及意见领袖关注着此节 路集合为Q2。则在时刻新增加的超三角形集 点代表的信息实体。 合为S2(S2nS),记为A;在时刻消失的超三角 形为S1(S,nS),记为B。在t1时刻的集聚系数为 4基于超网络模型的事件演化分析 C,=6x5/ (5) 12 本文以长生疫苗事件为例,来验证本文所构 最终的迁移水平计算式为 建的三层超网络,分析舆论发展酝酿期动力学因素。 C=AI+1固x6xSl 4.1长生疫苗事件 (6) ISl 12i1 从网上抓取了长生疫苗事件相关微博,总计 最后总的演变系数为 106769条,日期为2018年7月16日一7月26日 C=C1+C2= 6×(A+B+ISD (7) 共10天,主要包括发帖人、发帖内容、转发@账 12 户、转发文章及新闻等。演化分析主要考虑对 微博数据构建三层超网络模型,通过超网络结 构上的变化,分析舆论酝酿期积蓄力量的潜在 要素。 抓取数据每天的数量以及事后的新闻总结报 道内容如图4所示。7月16日起药监局发出公告 通告长春长生疫苗造假,至7月21日微博出现 e OVa 《疫苗之王》,可作为整场舆论事件的酝酿期; 1,时刻 时刻 21日一23日可作为事件的爆发期。通过整理相 图3结构变化说明图 关事件报导,发现不断发布新信息的时间段和微 Fig.3 Structural change illustration 博相关发帖量的爆发阶段并不完全吻合。 长春长生收到处罚 李克强总理 书,百白破疫苗违规 做出批示 长春长生发布公告道款 微博数量变化 《疫苗之王》 国家药监局通告长春长生狂犬 5386 病疫苗生产记录造假,收回证 书:长春长生对疫苗实施召回 22157 351322271036951 32794031 764472743 1617181920212223242526 日期/日 图4微博数量变化及主要事件说明 Fig.4 Number change of microblogs and description of major events
度给出判断。 结合前面的分析,演化系数的计算式主要由 两部分构成:计算聚焦水平和迁移水平。聚焦水 平可以直接由集聚系数计算得到。本文认为,超三 和二路新旧更替越严重,则迁移水平越高,可以用 新增加和消失的超三角形总量占总超三角形的比 例来衡量;另一方面,集聚系数越高的超网络其 同样比例的超三角形变化应该具有更高的迁移水平。 t1 S 1 Q1 t2 S 2 Q2 t2 S 2\ (S 2 ∩S 1) t2 S 1\ (S 2 ∩S 1) t1 以图 3 为例,记 时刻的超三角形集合为 , 二路集合为 , 时刻的超三角形集合为 ,二 路集合为 。则在 时刻新增加的超三角形集 合为 ,记为 A;在 时刻消失的超三角 形为 ,记为 B。在 时刻的集聚系数为 C1 = 6×|S 1| |Q1| (5) 最终的迁移水平计算式为 C2 = |A|+|B| |S 1| × 6×|S 1| |Q1| (6) 最后总的演变系数为 C = C1 +C2 = 6×(|A|+|B|+|S1|) |Q1| (7) t1 时刻 t2 时刻 va1 vt1 vk1 vk2 vk3 vk4 vt2 va2 va3 va4 va1 va3 va4 va5 v vt3 vt1 t2 vk1 vk2 vk3 vk4 图 3 结构变化说明图 Fig. 3 Structural change illustration 3.4 节点超度 vt (vα, vt , vk) vt 某个节点的超度定义为该节点参与组成的超 边数目[30]。节点 的超度为 l,当存在 l 条超边 均包含 。节点超度在具体节点代表不 同含义时也有着不同的意义。以本文的三层超网 络为例,意见领袖层的节点超度代表的是该意见 领袖的影响力,超边越多,代表有越多的人通过 此意见领袖获取信息、发表意见;信息层的节点 超度代表的是该信息点在此次舆论事件中的关注 水平,表示有更多的民众及意见领袖关注着此节 点代表的信息实体。 4 基于超网络模型的事件演化分析 本文以长生疫苗事件为例,来验证本文所构 建的三层超网络,分析舆论发展酝酿期动力学因素。 4.1 长生疫苗事件 从网上抓取了长生疫苗事件相关微博,总计 106 769 条,日期为 2018 年 7 月 16 日—7 月 26 日 共 10 天,主要包括发帖人、发帖内容、转发@账 户、转发文章及新闻等。演化分析主要考虑对 微博数据构建三层超网络模型,通过超网络结 构上的变化,分析舆论酝酿期积蓄力量的潜在 要素。 抓取数据每天的数量以及事后的新闻总结报 道内容如图 4 所示。7 月 16 日起药监局发出公告 通告长春长生疫苗造假,至 7 月 21 日微博出现 《疫苗之王》,可作为整场舆论事件的酝酿期; 21 日—23 日可作为事件的爆发期。通过整理相 关事件报导,发现不断发布新信息的时间段和微 博相关发帖量的爆发阶段并不完全吻合。 3 513 2 227 1 036 951 3 279 4 031 53 864 22 157 7 641 4 727 3 343 16 17 18 19 20 21 22 23 24 25 26 国家药监局通告长春长生狂犬 病疫苗生产记录造假,收回证 书;长春长生对疫苗实施召回 长春长生发布公告道歉 长春长生收到处罚 书,百白破疫苗违规 《疫苗之王》 李克强总理 做出批示 微博数量变化 日期/日 图 4 微博数量变化及主要事件说明 Fig. 4 Number change of microblogs and description of major events ·874· 智 能 系 统 学 报 第 15 卷