第12卷第2期 智能系统学报 Vol.12 No.2 2017年4月 CAAI Transactions on Intelligent Systems Apr.2017 D0I:10.11992/6is.201508012 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20170217.0954.002.html 企业、政府与公众公共健康提升激励机制演化分析 曲卫华12,颜志军3 (1.太原学院计算中心,山西太原030032:2.山西大学管理与决策研究中心,山西太原030006:3.北京理工大学 管理与经济学院,北京100081) 摘要:我国能源消费导致的环境污染严重影响公众的公共健康水平。在考虑公众公共健康损失赔偿的情况下,构 建了企业、政府与公众的三方演化博弈模型以分析三方策略的选择机制及影响因素。演化博弈理论认为在三维空 间区域内,三方没有收敛于某一结果的演化稳定策略。研究发现,在一定条件下,在三维空间的某一区域内,三方可 收敛到理想的演化博弈稳定策略:{实行能源转型、企业监管、公众参与环境管理}。并用数值仿真展示了在理想演 化博弈稳定策略情景下,不同政策决策参数对演化结果的影响。研究结果表明,在政府群体实行监管比例固定的条 件下,公众群体参与环境管理比例越大或公众公共健康损失赔偿越大,企业群体演化与实行能源转型策略的速度越 快。同时,讨论了政府补贴、税收减免、政府罚款对演化结果的影响,提出了相应的政策建议。 关键词:能源消费:企业污染:政府监管:公众参与:博弈 中图分类号:TP3;062.2:C93文献标志码:A文章编号:1673-4785(2017)02-0237-07 中文引用格式:曲卫华,颜志军.企业、政府与公众公共健康提升激励机制演化分析[J].智能系统学报,2017,12(2):237-249. 英文引用格式:QU Weihua,YAN Zhijun.Evolutionary analysis of incentive mechanisms for enterprises,governments,and the public to achieve environmental health improvements[J].CAAI transactions on intelligent systems,2017,12(2):237-249. Evolutionary analysis of incentive mechanisms for enterprises,governments, and the public to achieve environmental health improvements QU Weihua2,YAN Zhijun (1.Computer Center,Taiyuan University,Taiyuan 030032,China;2.Institute of Management and Decision,Shanxi University, Taiyuan 030006,China;3.School of Management and Economics,Beijing Institute of Technology,Beijing 100081,China) Abstract:The effects environmental pollution caused by energy consumption are having on public health in China are quickly becoming increasingly serious.In this paper,we establish an evolutionary game model for enterprises, governments,and the public to analyze selection mechanisms and impact factors of these three constituents,thus considering health damage compensation.From game theory,these three stakeholders fail to converge to an ideal evolutionary stable strategy in some domains of the given three-dimensional space:however,we have found that, under certain conditions,these three stakeholders can converge to an ideal evolutionary stable strategy in certain domains,i.e.,implementing energy transformation,enterprise regulation,and public participation in environment control.We show the effects that the variety of decision-making parameters have on evolutionary results via numeri- cal experiments.We found that when the proportion of influence that the government group exercises in terms of reg- ulations remains fixed,the higher the proportion of public participation in environmental management(and there- fore higher health damage compensation)and the faster the speed by which the enterprise group evolves and energy transformation is realized.We also discuss the effects that government subsidies,tax deductions and exemptions, and government fines have on the evolutionary results,making some suggestions for policymakers as part of our con- clusions. Keywords:energy consumption;enterprise pollution;government regulation;public participation;game theory 我国以煤炭为主的化石能源消费产生了大量危氧化合物、悬浮颗粒物(TS)、颗粒物(PI0)、细颗 害公共健康的污染物,包括二氧化硫、烟尘、粉尘、氨 粒物(PM2.5)等,这些污染物是引发雾霾天气的主 要原因口,对呼吸系统疾病、心脑血管疾病等公共 收稿日期:2015-08-13.网络出版日期:2017-02-17. 健康水平有严重威胁。研究表明,由2013年1月的 基金项目:北京市自然科学基金项目(9152015). 通信作者:颜志军E-mail:yanzhijun(@bit.cdu.cn. 雾霾天气导致的健康经济损失总额约为226亿元
第 12 卷第 2 期 智 能 系 统 学 报 Vol.12 №.2 2017 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2017 DOI:10.11992 / tis.201508012 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20170217.0954.002.html 企业、政府与公众公共健康提升激励机制演化分析 曲卫华1,2 ,颜志军3 (1. 太原学院 计算中心,山西 太原 030032; 2. 山西大学 管理与决策研究中心,山西 太原 030006; 3.北京理工大学 管理与经济学院,北京 100081) 摘 要:我国能源消费导致的环境污染严重影响公众的公共健康水平。 在考虑公众公共健康损失赔偿的情况下,构 建了企业、政府与公众的三方演化博弈模型以分析三方策略的选择机制及影响因素。 演化博弈理论认为在三维空 间区域内,三方没有收敛于某一结果的演化稳定策略。 研究发现,在一定条件下,在三维空间的某一区域内,三方可 收敛到理想的演化博弈稳定策略:{实行能源转型、企业监管、公众参与环境管理}。 并用数值仿真展示了在理想演 化博弈稳定策略情景下,不同政策决策参数对演化结果的影响。 研究结果表明,在政府群体实行监管比例固定的条 件下,公众群体参与环境管理比例越大或公众公共健康损失赔偿越大,企业群体演化与实行能源转型策略的速度越 快。 同时,讨论了政府补贴、税收减免、政府罚款对演化结果的影响,提出了相应的政策建议。 关键词:能源消费;企业污染; 政府监管;公众参与;博弈 中图分类号: TP3; 062.2; C93 文献标志码:A 文章编号:1673-4785(2017)02-0237-07 中文引用格式:曲卫华,颜志军. 企业、政府与公众公共健康提升激励机制演化分析[J]. 智能系统学报, 2017, 12(2): 237-249. 英文引用格式:QU Weihua, YAN Zhijun. Evolutionary analysis of incentive mechanisms for enterprises, governments, and the public to achieve environmental health improvements[J]. CAAI transactions on intelligent systems, 2017, 12(2): 237-249. Evolutionary analysis of incentive mechanisms for enterprises, governments, and the public to achieve environmental health improvements QU Weihua 1,2 , YAN Zhijun 3 (1.Computer Center, Taiyuan University, Taiyuan 030032, China; 2. Institute of Management and Decision, Shanxi University, Taiyuan 030006, China; 3.School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China) Abstract:The effects environmental pollution caused by energy consumption are having on public health in China are quickly becoming increasingly serious. In this paper, we establish an evolutionary game model for enterprises, governments, and the public to analyze selection mechanisms and impact factors of these three constituents, thus considering health damage compensation. From game theory, these three stakeholders fail to converge to an ideal evolutionary stable strategy in some domains of the given three⁃dimensional space; however, we have found that, under certain conditions, these three stakeholders can converge to an ideal evolutionary stable strategy in certain domains, i.e., implementing energy transformation, enterprise regulation, and public participation in environment control. We show the effects that the variety of decision⁃making parameters have on evolutionary results via numeri⁃ cal experiments. We found that when the proportion of influence that the government group exercises in terms of reg⁃ ulations remains fixed, the higher the proportion of public participation in environmental management (and there⁃ fore higher health damage compensation) and the faster the speed by which the enterprise group evolves and energy transformation is realized. We also discuss the effects that government subsidies, tax deductions and exemptions, and government fines have on the evolutionary results, making some suggestions for policymakers as part of our con⁃ clusions. Keywords: energy consumption; enterprise pollution; government regulation; public participation; game theory 收稿日期:2015-08-13. 网络出版日期:2017-02-17. 基金项目:北京市自然科学基金项目(9152015). 通信作者:颜志军.E⁃mail: yanzhijun@ bit.edu.cn. 我国以煤炭为主的化石能源消费产生了大量危 害公共健康的污染物,包括二氧化硫、烟尘、粉尘、氮 氧化合物、悬浮颗粒物(TSP)、颗粒物(PM10)、细颗 粒物(PM2.5)等,这些污染物是引发雾霾天气的主 要原因[1] ,对呼吸系统疾病、心脑血管疾病等公共 健康水平有严重威胁。 研究表明,由 2013 年 1 月的 雾霾天气导致的健康经济损失总额约为 226 亿元
·238 智能系统学报 第12卷 相当于2011年平均月度卫生总费用的11.2%2】。 企业与公众的两方博弈研究,对于政府、企业与公众 现有文献主要从健康经济损失、政府监管和公 三方博弈的相关研究比较少:2)在研究方法上,大多 众参与等几个角度研究企业、政府和公众三方的能 数研究主要采用暴露响应与剂量效应原理的解析法 源消费、环境保护与公共健康问题。1)从健康经济 或仅研究企业排污与政府监控、企业排污与公众参与 损失角度来看,Xa等)通过对我国30个省份环境 的两方博弈,未综合考虑企业能源转型、政府监管与 污染物导致的公众健康经济损失研究,使用投入产 公众参与环境三者的动态机理,而公众参与行为对政 出方法表明,2007年,由环境污染造成的公众公共 府监管力度与企业排污程度有重要影响:3)在数值仿 健康损失大约为3460亿元;Wang)研究了我国不 真方面,现有研究很少有对企业能源转型、政府监管 同地区企业能源消费产生的污染物对公共健康的影 与公众参与环境管理三方博弈的算例分析,而数值仿 响,利用剂量效应与暴露响应原理分析表明,以化石 真计算是科学技术探索研究的主要方法和手段之一, 能源消费为主的能源结构排放的污染物严重影响着 对于抽象且为动态及局部细节的研究问题,数值仿真 公众的公共健康水平,其排放的S02与PM10在2020 具有直观、可行性高的优点。 年导致的公共健康损失将达到4520~6150亿元, 为此,本文将排污企业、地方政府和公众3个主 几乎占同期GDP的1.06%。之后,学者们结合能源 体一同纳入到模型中,考虑公众健康损失赔偿大小, 消费、环境污染、经济增长和公公建康因素运用 综合研究三者间的相互机理:运用演化博弈论动态 LEAP模型和计量方法研究企业能源消费对环境、 分析排污企业是否实行能源转型、政府是否监管以 经济以及公共健康的影响,如Zhangts)、曲卫华 及公众是否参与环境管理行为的相互影响:最后用 等[6.2)从政府监管角度出发,Dong、Li]等运用 数值算例仿真了不同政策参数取值情况下各博弈方 静态博弈理论研究了中国电镀企业清洁生产的政策 的演化行为,为企业能源转型与公共健康水平提升 实施效果,认为政府的税收减免、生产设备补贴、清 政策的制定提供有力支撑。 洁能源创新成本补贴以及企业排污监管力度等措施 1政府、企业和公众三方博弈模型 对高污染企业向清洁化生产方向转型有重要影响。 近期学者通过最优化模型、信号博弈论的方法研究 1.1演化博弈模型假设 企业能源转型、技术创新、政府税收政策对环保的影 1.1.1博弈主体 响,如许士春等8,郭丕斌等[,Zheng等o,i 化石能源消费排放造成环境污染的直接利益相 等川,张国兴等[]。3)从公众参与角度出发,学 关者有:地方政府(简称“政府”)、排污企业和公众, 者们运用委托代理模型对企业的实证研究认为公众 3个博弈方均是有限理性。从地方政府角度来看, 参与力度对企业向绿色方向发展有重要影响,如 政府很可能会监管企业排污行为,对排污超标准的 Gera等[]。朱庆华和窦一杰通过构建政府补贴的 企业实行罚款、限制其生产(以下简称“监管”),也 绿色供应链管理博弈模型,研究认为政府应努力培 可能因为顾忌监管成本及影响本地区的国内生产总 育消费者的环保意识,这一举措是使政府和消费者 值下降而选择不监管(以下简称“不监管”):从企业 共赢的长远之计4,在此基础上,学者们对公众参 角度来看,企业很可能因为利益的驱使和顾忌能源 与下的企业环境行为进行研究,结果得出公众参与 转型成本继续以传统化石能源消费生产致使污染物 环境管理对企业减少环境污染行为有重要作用,如 超标准排放(以下简称“不实行能源转型”),也可能 Kaldellis等1s-6,杜建国等,郑思齐等[)。 顾忌政府的惩罚和实行能源转型后政府的补贴而实 上述研究对促进企业向绿色方向转型发展、提高 行能源转型(以下简称“实行能源转型”):从公众角 公众公共健康水平政策具有借鉴意义。但是在研究 度来看,公众很可能由于对环保意识的淡薄不参与 内容、研究方法与参数选择方面存在不足,忽略了我 环境管理(以下简称“不参与环境管理”),也可能考 国能源消费背景下,企业排污、政府监管与公众参与 虑企业排污带来的环境污染会使身体健康受损失而 三方的相互制约机理。具体来说,1)在研究内容上, 参与环境管理(以下简称“参与环境管理”)。由于 现有的博弈研究中仅涉及政府对公众参与环境管理 3个参与博弈方都是学习能力有限的理性参与人, 行为方面的奖励,没有考虑企业排污对公众公共健康 在信息不完全的情况下,三方在进行决策时往往不 损失赔偿因素,然而,企业排污严重影响着公众公共 会一开始就找到最优策略,会在博弈过程中学习博 健康水平的高低:现有研究仅涉及的是政府与企业、 弈,根据以往收益较大的策略不断调整自己的策略
相当于 2011 年平均月度卫生总费用的 11.2% [2] 。 现有文献主要从健康经济损失、政府监管和公 众参与等几个角度研究企业、政府和公众三方的能 源消费、环境保护与公共健康问题。 1)从健康经济 损失角度来看,Xia 等[3]通过对我国 30 个省份环境 污染物导致的公众健康经济损失研究,使用投入产 出方法表明,2007 年,由环境污染造成的公众公共 健康损失大约为 3 460 亿元;Wang [4] 研究了我国不 同地区企业能源消费产生的污染物对公共健康的影 响,利用剂量效应与暴露响应原理分析表明,以化石 能源消费为主的能源结构排放的污染物严重影响着 公众的公共健康水平,其排放的 SO2与PM10在 2020 年导致的公共健康损失将达到 4 520 ~ 6 150 亿元, 几乎占同期 GDP 的 1.06%。 之后,学者们结合能源 消费、环境污染、 经济增长和公公健康因素运用 LEAP 模型和计量方法研究企业能源消费对环境、 经济 以 及 公 共 健 康 的 影 响, 如 Zhang [5] 、 曲 卫 华 等[6] 。 2) 从政府监管角度出发,Dong、Li [7] 等运用 静态博弈理论研究了中国电镀企业清洁生产的政策 实施效果,认为政府的税收减免、生产设备补贴、清 洁能源创新成本补贴以及企业排污监管力度等措施 对高污染企业向清洁化生产方向转型有重要影响。 近期学者通过最优化模型、信号博弈论的方法研究 企业能源转型、技术创新、政府税收政策对环保的影 响,如许士春等[8] ,郭丕斌等 [9] , Zheng 等[10] , Li 等[11] ,张国兴等 [12] 。 3)从公众参与角度出发, 学 者们运用委托代理模型对企业的实证研究认为公众 参与力度对企业向绿色方向发展有重要影响,如 Gera 等 [13] 。 朱庆华和窦一杰通过构建政府补贴的 绿色供应链管理博弈模型,研究认为政府应努力培 育消费者的环保意识,这一举措是使政府和消费者 共赢的长远之计[14〛 ,在此基础上,学者们对公众参 与下的企业环境行为进行研究,结果得出公众参与 环境管理对企业减少环境污染行为有重要作用,如 Kaldellis 等[15-16] ,杜建国等[17] ,郑思齐等 [18] 。 上述研究对促进企业向绿色方向转型发展、提高 公众公共健康水平政策具有借鉴意义。 但是在研究 内容、研究方法与参数选择方面存在不足,忽略了我 国能源消费背景下,企业排污、政府监管与公众参与 三方的相互制约机理。 具体来说,1)在研究内容上, 现有的博弈研究中仅涉及政府对公众参与环境管理 行为方面的奖励,没有考虑企业排污对公众公共健康 损失赔偿因素,然而,企业排污严重影响着公众公共 健康水平的高低;现有研究仅涉及的是政府与企业、 企业与公众的两方博弈研究,对于政府、企业与公众 三方博弈的相关研究比较少;2)在研究方法上,大多 数研究主要采用暴露响应与剂量效应原理的解析法 或仅研究企业排污与政府监控、企业排污与公众参与 的两方博弈,未综合考虑企业能源转型、政府监管与 公众参与环境三者的动态机理,而公众参与行为对政 府监管力度与企业排污程度有重要影响;3)在数值仿 真方面,现有研究很少有对企业能源转型、政府监管 与公众参与环境管理三方博弈的算例分析,而数值仿 真计算是科学技术探索研究的主要方法和手段之一, 对于抽象且为动态及局部细节的研究问题,数值仿真 具有直观、可行性高的优点。 为此,本文将排污企业、地方政府和公众 3 个主 体一同纳入到模型中,考虑公众健康损失赔偿大小, 综合研究三者间的相互机理;运用演化博弈论动态 分析排污企业是否实行能源转型、政府是否监管以 及公众是否参与环境管理行为的相互影响;最后用 数值算例仿真了不同政策参数取值情况下各博弈方 的演化行为,为企业能源转型与公共健康水平提升 政策的制定提供有力支撑。 1 政府、企业和公众三方博弈模型 1.1 演化博弈模型假设 1.1.1 博弈主体 化石能源消费排放造成环境污染的直接利益相 关者有:地方政府(简称“政府”)、排污企业和公众, 3 个博弈方均是有限理性。 从地方政府角度来看, 政府很可能会监管企业排污行为,对排污超标准的 企业实行罚款、限制其生产(以下简称“监管”),也 可能因为顾忌监管成本及影响本地区的国内生产总 值下降而选择不监管(以下简称“不监管”);从企业 角度来看,企业很可能因为利益的驱使和顾忌能源 转型成本继续以传统化石能源消费生产致使污染物 超标准排放(以下简称“不实行能源转型”),也可能 顾忌政府的惩罚和实行能源转型后政府的补贴而实 行能源转型(以下简称“实行能源转型”);从公众角 度来看,公众很可能由于对环保意识的淡薄不参与 环境管理(以下简称“不参与环境管理”),也可能考 虑企业排污带来的环境污染会使身体健康受损失而 参与环境管理(以下简称“参与环境管理”)。 由于 3 个参与博弈方都是学习能力有限的理性参与人, 在信息不完全的情况下,三方在进行决策时往往不 会一开始就找到最优策略,会在博弈过程中学习博 弈,根据以往收益较大的策略不断调整自己的策略。 ·238· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·239· 1.1.2模型参数 的定义和假设,建立化石能源消费背景下企业-政 为了研究各个博弈策略组合下,地方政府、排污 府-公众的三方博弈模型,如图1所示。根据模型 企业与公众三者的成本、收益与损失情况,设定下列 假设和图1得出相应的收益矩阵,8种收益组合如 相关政策参数和输入参数,如表1所示。通过上述表2所示,收益结果分别对应企业、政府和公众。 表1主要参数及其含义 Table 1 Main parameters and its meanings 参数 含义 政 a 企业实行能源转型后,政府对其减免税收的比率 策B 政府给予实行能源转型企业成本的补贴比例 参E 不实行能源转型的企业对公众公共健康损失的赔偿(即公众要求的赔偿) 数F 企业不实行能源转型、政府对企业的罚金 A 政府对参与环境管理的公众的奖励 C 企业实行能源转型所增加的技术、原材料与人力等成本 C2 企业继续排污、不实行能源转型的机会成本(包括企业形象破坏、公众抵制企业产品等) C 公众参与环境管理的成本 输 Ca 政府监管排污企业的成本 企业实行能源转型前,政府对其的税率 参 r 实行能源转型前,企业的净收益 数 To 实行能源转型企业增加的收益 8 不实行能源转型的企业被政府发现的概率 T 企业实行能源转型、环境质量改善后,公众所获得的公共健康水平收益 R 企业不实行能源转型导致的环境污染对居民的公共健康损失 R2 当政府对排污企业不监管,被公众发现后,政府形象、声誉的损失 政府不监管企业的行为被公众发现后,政府由于工作失职,应对环境污染导致的公共健康损失 E2 向公众支付额外的赔偿 62 政府不监管排污企业的行为被公众发现的概率 T2 公众参与环境管理过程中,对实行能源转型的企业产生了好感,企业因此得到的收益 政府监管环境排污行为有效,导致环境污染减少,公众参与环境管理对政府产生了好感,政府因名声提高 T: 等而得到的收益 表2企业-政府-公众收益矩阵 Table 2 Pay off matrix of enterprises,governments and the public 博弈策略 收益结果 1(1-r)[πe-(1-B)C:+T]+T2, (实行,监管,参与) aT[Tr -(1-B)C:+To]-BC:-C.+3,-C3 +A (实行,监管,不参与) {(1-ar)[Tr-(1-B)C,+π],ar[πg-(1-B)C1+πo]-BC,-C4,m1} (实行,不监管,参与) {(1-r)(mg-C,+mo)+T2,r(me-C1+mo)-0,R2,m1-C3+A (实行,不监管,不参与) (1-T)(TF -C1+To),7(T-C:+To), (不实行,监管,参与) {(1-T)πe-0F-E,-C2,Tmg+8F-C4+T;,π1-C3+A-R,+E,} (不实行,监管,不参与) (1-T)TF -0F-C2 TTE +0F-Ca,-R1 (不实行,不监管,参与) {(1-r)πe-E1-C2,tme-6E2,T1-C3+A+E,-R,+62E2} (不实行,不监管,不参与) (1-T)TE-C2,ITE,-R
1.1.2 模型参数 为了研究各个博弈策略组合下,地方政府、排污 企业与公众三者的成本、收益与损失情况,设定下列 相关政策参数和输入参数,如表 1 所示。 通过上述 的定义和假设,建立化石能源消费背景下企业-政 府-公众的三方博弈模型,如图 1 所示。 根据模型 假设和图 1 得出相应的收益矩阵,8 种收益组合如 表 2 所示,收益结果分别对应企业、政府和公众。 表 1 主要参数及其含义 Table 1 Main parameters and its meanings 参数 含义 政 策 参 数 α 企业实行能源转型后,政府对其减免税收的比率 β 政府给予实行能源转型企业成本的补贴比例 E1 不实行能源转型的企业对公众公共健康损失的赔偿(即公众要求的赔偿) F 企业不实行能源转型、政府对企业的罚金 A 政府对参与环境管理的公众的奖励 C1 企业实行能源转型所增加的技术、原材料与人力等成本 C2 企业继续排污、不实行能源转型的机会成本(包括企业形象破坏、公众抵制企业产品等) C3 公众参与环境管理的成本 输 C4 政府监管排污企业的成本 入 τ 企业实行能源转型前,政府对其的税率 参 πF 实行能源转型前,企业的净收益 数 π0 实行能源转型企业增加的收益 θ1 不实行能源转型的企业被政府发现的概率 π1 企业实行能源转型、环境质量改善后,公众所获得的公共健康水平收益 R1 企业不实行能源转型导致的环境污染对居民的公共健康损失 R2 当政府对排污企业不监管,被公众发现后,政府形象、声誉的损失 E2 政府不监管企业的行为被公众发现后,政府由于工作失职,应对环境污染导致的公共健康损失 向公众支付额外的赔偿 θ2 政府不监管排污企业的行为被公众发现的概率 π2 公众参与环境管理过程中,对实行能源转型的企业产生了好感,企业因此得到的收益 π3 政府监管环境排污行为有效,导致环境污染减少,公众参与环境管理对政府产生了好感,政府因名声提高 等而得到的收益 表 2 企业-政府-公众收益矩阵 Table 2 Pay off matrix of enterprises, governments and the public 博弈策略 收益结果 (实行,监管,参与) { (1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 , ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 , π1 - C3 + A } (实行,监管,不参与) { (1 - ατ)[πF - (1 - β)C1 + π0 ] , ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 , π1 } (实行,不监管,参与) { (1 - τ)(πF - C1 + π0 ) + π2 , τ(πF - C1 + π0 ) - θ2R2 , π1 - C3 + A } (实行,不监管,不参与) { (1 - τ)(πF - C1 + π0 ) , τ(πF - C1 + π0 ) , π1 } (不实行,监管,参与) { (1 - τ)πF - θ1F - E1 - C2 , τπF + θ1F - C4 + π3 , π1 - C3 + A - R1 + E1 } (不实行,监管,不参与) { (1 - τ)πF - θ1F - C2 , τπF + θ1F - C4 , - R1 } (不实行,不监管,参与) { (1 - τ)πF - E1 - C2 , tπF - θ2E2 , π1 - C3 + A + E1 - R1 + θ2E2 } (不实行,不监管,不参与) { (1 - τ)πF - C2 , tπF , - R1 } 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·239·
.240 智能系统学报 第12卷 π3}+x(1-z){ar[πp-(1-B)C1+To]-BC1- (企业 C4}+(1-x)z(Tπp+01F-C4+T3)+(1-x) 实行能源转型不实行能源转型 (1-z)(rπe+8,F-C4) 政府 政府 U2N=x2T(Tg-C+To)-02R2]+x(1- 监管 木监管 监管 不监管 2)[T(T-C:+To)]+(1-x)2(tTE- 公众 公众 公众 公众 02E2)+(1-x)(1-z)(tmr) 不参与参与不参与 参与不参与参与不参与 02=yUy+(1-y)U2x=ylxzlaT[πr-(1- (2)(3) (4)(5) (6)(7) (8) B)C+To]-BC1-Ca+T3+x(1-z)aT[TP- 图1企业-政府-公众三方博弈模型 (1-β)C,+To]-BC1-C4}+(1-x)z(rTr+0F- Fig.I Tripartite game model among enterprises,gov- C4+π3)+(1-x)(1-z)(rπp+0,F-C4)}+(1- ernments and the public y)x2[T(TF-C+To)-03R2]+x(1-2)[T(TP- 1.2演化博弈模型建立 C1+To)]+(1-x)z(tmp-02E2)+ 假设企业群体选择“实行能源转型”的比例为x (1-x)(1-z)(tmF)} (0≤x≤1),选择“不实行能源转型”的比例为1一 3)公众的期望收益为 x:政府群体选择“监管”的比例为y(0≤y≤1), Uy=xy(T1-C3+A)+x(1-y)((T1-C3+A)+ 选择“不监管”的比例为1一y;公众群体选择“参与 (1-x)y(T1-C3+A-R,+E,)+(1-x)(1- 环境管理”的比例为:,选择“不参与环境管理”的比 y)(T1-C3+A+E1-R1+02E2) 例为1-z(0≤z≤1)。设企业“实行能源转型”与 Uw=xyT1+x(1-y)T1+(1-x)y(-R,)+ “不实行能源转型”的期望收益及总的平均收益分 (1-x)(1-y)(-R) 别为Uy、U1w和U1;政府“监管”与“不监管”的期 U3=2U3y -(1-z)Uw=zxy(T-C3+A) 望收益及总的平均收益分别为Uy、U2x和U2;公众 x(1-y)(T1-C3+A)+(1-x)y(T1-C3+A- 选择“参与环境管理”与“不参与环境管理的期望收 R1+E)+(1-x)(1-y)(π1-C3+A+E,- R,+92E2)}-(1-z){xyT1+x(1-y)m1+(1- 益及总的平均收益分别为Uy、Uw和U。 x)y(-R,)+(1-x)(1-y)(-R1)} 根据以上分析,可以构建各博弈方的收益期望,1.3基于复制动态方程的稳定策略 其中: 根据演化博弈理论原理可知,当某一种策略的 1)企业的期望收益为 支付或适应度比种群的平均适应度高时,这种策略 Uy=yz(1-aT)[T-(1-B)C+To]+T2+ 在种群中就会演化发展,具体表现是种群中使用某 y(1-z){(1-ar)[πe-(1-B)C1+To]}+ 种策略的个体在种群中所在比例增长率大于零,这 (1-y)z[(1-r)(Tr-C1+To)+T2]+ 一过程称为复制动态方程。实际上,复制动态方程 (1-y)(1-z)[(1-r)(Te-C1+To)] 是某种特定策略在某一种群中被采用的频率或频度 Uw=yz[(1-t)πF-0F-E1-C2]+y(1-z) 的动态微分方程1。 [(1-t)πe-0F-C2]+(1-y)z[(1-t)πe- 1)基于复制动态方程原理,可构造企业策略的 E,-C2]+(1-y)(1-z)[(1-t)πp-C2] 复制动态方程为 U=xUy +(1-x)Uw=xyz(1-aT)[TF- F(x)= =x(Uw-0)= (1-B)C1+To]+T2}+xy(1-z){(1-aT)[Tr- x(1-x)(C1-T0-C1-E,+TT0-zT2- (1-B)C1+πo]}+x(1-y)[(1- ByC+TyC-01yF TyTe -TyT0 aTyC T)(πe-C1+π)+m2]+x(1-y)(1-z)[(1- aTyTTg TaByC atyzTo)= r)(πp-C+To)]+(1-x)yz[(1-T)πe-8F- x(1-x)[z(C2-E1-T2-yC2 yaTTo)+ E1-C2]+(1-x)y(1-z)[(1-T)πp-0F- y(C2 +TC-BC-0F-TTE- C2]+(1-x)(1-y)z[(1-T)Tp-E,-C2]+ TTO QTC aTTE TaBC)+C-C2- (1-x)(1-y)(1-z)[(1-T)Tp-C2] T0-TC1+TT。] 2)政府的期望收益为 ①若 U2y=xzaT[TP-(1-B)C To]-BC1-Ca+ 2=[y(C2 +TC-BC1-0F-TTF-TTO-
图 1 企业-政府-公众三方博弈模型 Fig.1 Tripartite game model among enterprises, gov⁃ ernments and the public 1.2 演化博弈模型建立 假设企业群体选择“实行能源转型”的比例为 x ( 0 ≤ x ≤ 1),选择“不实行能源转型”的比例为 1 - x ;政府群体选择“监管”的比例为 y ( 0 ≤ y ≤ 1), 选择“不监管”的比例为 1 - y ;公众群体选择“参与 环境管理”的比例为 z ,选择“不参与环境管理”的比 例为 1 - z ( 0 ≤ z ≤ 1)。 设企业“实行能源转型”与 “不实行能源转型” 的期望收益及总的平均收益分 别为 U1Y 、 U1N 和 U - 1 ;政府“监管”与“不监管”的期 望收益及总的平均收益分别为 U2Y 、 U2N 和 U - 2 ;公众 选择“参与环境管理”与“不参与环境管理的期望收 益及总的平均收益分别为 U3Y 、 U3N 和 U - 3 。 根据以上分析,可以构建各博弈方的收益期望, 其中: 1)企业的期望收益为 U1Y = yz{(1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 } + y(1 - z){(1 - ατ)[πF - (1 - β)C1 + π0 ]} + (1 - y)z[(1 - τ)(πF - C1 + π0 ) + π2 ] + (1 - y)(1 - z)[(1 - τ)(πF - C1 + π0 )] U1N = yz[(1 - t)πF - θ1F - E1 - C2 ] + y(1 - z) [(1 - t)πF - θ1F - C2 ] + (1 - y)z[(1 - t)πF - E1 - C2 ] + (1 - y)(1 - z)[(1 - t)πF - C2 ] U - 1 = xU1Y + (1 - x)U1N = xyz{(1 - ατ)[πF - (1 - β)C1 + π0 ] + π2 } + xy(1 - z){(1 - ατ)[πF - (1 - β)C1 + π0 ]} + x(1 - y)z[(1 - τ)(πF - C1 + π0 ) + π2 ] + x(1 - y)(1 - z)[(1 - τ)(πF - C1 + π0 )] + (1 - x)yz[(1 - τ)πF - θ1F - E1 - C2 ] + (1 - x)y(1 - z)[(1 - τ)πF - θ1F - C2 ] + (1 - x)(1 - y)z[(1 - τ)πF - E1 - C2 ] + (1 - x)(1 - y)(1 - z)[(1 - τ)πF - C2 ] 2)政府的期望收益为 U2Y = xz{ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 } + x(1 - z){ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 } + (1 - x)z(τπF + θ1F - C4 + π3 ) + (1 - x) (1 - z)(τπF + θ1F - C4 ) U2N = xz[τ(πF - C1 + π0 ) - θ2R2 ] + x(1 - z)[τ(πF - C1 + π0 )] + (1 - x)z(tπF - θ2E2 ) + (1 - x)(1 - z)(tπF ) U - 2 = yU2Y + (1 - y)U2N = y{xz{ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 + π3 } + x(1 - z){ατ[πF - (1 - β)C1 + π0 ] - βC1 - C4 } + (1 - x)z(τπF + θ1F - C4 + π3 ) + (1 - x)(1 - z)(τπF + θ1F - C4 )} + (1 - y){xz[τ(πF - C1 + π0 ) - θ2R2 ] + x(1 - z)[τ(πF - C1 + π0 )] + (1 - x)z(tπF - θ2E2 ) + (1 - x)(1 - z)(tπF )} 3)公众的期望收益为 U3Y = xy(π1 - C3 + A) + x(1 - y)((π1 - C3 + A) + (1 - x)y(π1 - C3 + A - R1 + E1 ) + (1 - x)(1 - y)(π1 - C3 + A + E1 - R1 + θ2E2 ) U3N = xyπ1 + x(1 - y)π1 + (1 - x)y( - R1 ) + (1 - x)(1 - y)( - R1 ) U - 3 = zU3Y - (1 - z)U3N = z{xy(π1 - C3 + A) + x(1 - y)(π1 - C3 + A) + (1 - x)y(π1 - C3 + A - R1 + E1 ) + (1 - x)(1 - y)(π1 - C3 + A + E1 - R1 + θ2E2 )} - (1 - z){xyπ1 + x(1 - y)π1 + (1 - x)y( - R1 ) + (1 - x)(1 - y)( - R1 )} 1.3 基于复制动态方程的稳定策略 根据演化博弈理论原理可知,当某一种策略的 支付或适应度比种群的平均适应度高时,这种策略 在种群中就会演化发展,具体表现是种群中使用某 种策略的个体在种群中所在比例增长率大于零,这 一过程称为复制动态方程。 实际上,复制动态方程 是某种特定策略在某一种群中被采用的频率或频度 的动态微分方程[19] 。 1)基于复制动态方程原理,可构造企业策略的 复制动态方程为 F(x) = dx dt = x(U1Y - U - 1 ) = x(1 - x)(C1 - π0 - τC1 - zE1 + τπ0 - zπ2 - βyC1 + τyC1 - θ1 yF - τyπF - τyπ0 - ατyC1 + ατyπF + ταβyC1 + αtyzπ0 ) = x(1 - x)[z(C2 - E1 - π2 - yC2 + yατπ0 ) + y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] ①若 z = [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ·240· 智 能 系 统 学 报 第 12 卷
第2期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·241. QTC aTTe +TaBC)+C-C2 To -TC b)当 TTO]/(E +T2+yC2-C2 yaTo) a<[y(C2 +TC-BC-0F-TTF -TTO- 时,则F(x)=0,这意味着所有水平都是稳定状态。 QTC aTTE TaBC)C1-C2 To -TCI ②若 TTO]/(E+T2+yC2-C2-yaTTo) z≠[y(C2+TC1-BC1-0F-TTe-TT。- 11>0,10<0,此时x=0为 QTC1 aTTF TaBC1)+C1 C2 To -TCI 时,d dx TTO]/(E+T2+yC2-C2-yaTTo) 全局唯一的演化稳定策略:当公众参与环境管理达 时,令F(x)=0,得x=0,x=1是x的两个稳定点。 到一定程度并呈下降趋势时,污染企业实行能源转 对F(x)求导得: 型的可能性逐步减小,最终不实行能源转型策略是 dF(x=1-2x)[z(C2-E,-元2-C+ 其最优选择。企业群体3种情况下的动态趋势及稳 dx 定性如图2所示。 yaTTo)+y(C2 +TC -BC-0F-TTE -TTO QTC:aTTr TaBC)+C-C2 -To-TC TTO 当C2-E,-π2-yC,+arm。<0,又分两种情况: 1.0 a)当 0.8 2>[y(C2 +TC -BC-0F-TTE-TTO aTC+ 0.6 QTTTE TaBC1)+C-C2-To -TC +TTO]/ 0.4 (E1 T2+yC2-C2-yaTTo) 0.2 时.5(11>0,dF(1。<0,此时x=0为 Y0 .0 dx dx 全局唯一的演化稳定策略:当公众参与环境管理达 05 0.5 到一定程度并呈增大趋势时,污染企业实行能源转 .0 型的可能性逐步减小,最终不实行能源转型策略是 (a)公共健康损失赔偿较大时,企业行为演化图 其最优选择,显然此种状态不符合现实情况,是一种 无效状态。 b)当 1.0 2<[y(C2 +TC:-BC1-0F-TTF -TTO -aTC 0.8 aTTg TaBC)+C -C2 -To-TC +TTO]/ 0.6 (E T2 yC2-C2 -yaTTo) 0.4 时d5(11<0,dF(10>0,此时x=1为 0.2 dx dx 上0 全局唯一的演化稳定策略:当公众参与环境管理达 0 不到一定程度并呈下降趋势时,污染企业实行能源 05 0.5 转型的可能性逐步增大,实行能源转型策略是企业 01.0 的最优选择,显然此种状态也不符合现实情况,是一 (b)公众参与环境管理程度较高时,企业行为演化图 种无效状态。 71 当C2-E,-π2-yC2+yarm。>0,又分两种情祝: a)当 1.0 3>[y(C2 +TC1-BC1-0F-TTP-TTO-QTCI 0.8 QTTg TaBC)C-C2 TO -TC 0.6 TTo]/(E:+π2+yC2-C2-yarπo) 0.4 时,521<0.5巴>0此时=1为 0.2 dx 上0 全局唯一的演化稳定策略:当公众参与环境管理达 Lo 到一定程度并呈增大趋势时,污染企业实行能源转 0.5 0.5 型的可能性逐步加大,最终实行能源转型策略是其 01.0 最优选择。 (c)公众参与环境管理程度较低时,企业行为演化图
ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时,则 F(x) ≡ 0,这意味着所有水平都是稳定状态。 ②若 z ≠ [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时,令 F(x) = 0,得 x = 0, x = 1 是 x 的两个稳定点。 对 F(x) 求导得: dF(x) dx = (1 - 2x)[z(C2 - E1 - π2 - yC2 + yατπ0 ) + y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] 当 C2 - E1 - π2 - yC2 + yατπ0 < 0,又分两种情况: a)当 z > [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 > 0, dF(x) dx | x = 0 < 0,此时 x = 0 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈增大趋势时,污染企业实行能源转 型的可能性逐步减小,最终不实行能源转型策略是 其最优选择,显然此种状态不符合现实情况,是一种 无效状态。 b)当 z < [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 < 0, dF(x) dx | x = 0 > 0,此时 x = 1 为 全局唯一的演化稳定策略;当公众参与环境管理达 不到一定程度并呈下降趋势时,污染企业实行能源 转型的可能性逐步增大,实行能源转型策略是企业 的最优选择,显然此种状态也不符合现实情况,是一 种无效状态。 当 C2 - E1 - π2 - yC2 + yατπ0 > 0,又分两种情况: a)当 z > [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 < 0, dF(x) dx | x = 0 > 0,此时 x = 1 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈增大趋势时,污染企业实行能源转 型的可能性逐步加大,最终实行能源转型策略是其 最优选择。 b)当 z < [y(C2 + τC1 - βC1 - θ1F - τπF - τπ0 - ατC1 + ατπF + ταβC1 ) + C1 - C2 - π0 - τC1 + τπ0 ] / (E1 + π2 + yC2 - C2 - yατπ0 ) 时, dF(x) dx | x = 1 > 0, dF(x) dx | x = 0 < 0,此时 x = 0 为 全局唯一的演化稳定策略;当公众参与环境管理达 到一定程度并呈下降趋势时,污染企业实行能源转 型的可能性逐步减小,最终不实行能源转型策略是 其最优选择。 企业群体 3 种情况下的动态趋势及稳 定性如图 2 所示。 (a) 公共健康损失赔偿较大时,企业行为演化图 (b) 公众参与环境管理程度较高时,企业行为演化图 (c) 公众参与环境管理程度较低时,企业行为演化图 第 2 期 曲卫华,等:企业、政府与公众公共健康提升激励机制演化分析 ·241·