SARS传播的研究 「摘要] 本文通过对所得的疫区患者日志数据进行计算机分析,拟合出了SARS不同阶段的趋势曲 线,结合题目所给的模型,对它提出的半模拟循环计算的方法进行了检验,得出该模型的优点 在于形式简单,模拟的精确度较高,k值的改变体现出了其合理性,同时指出了它的主要缺点 在于过分依赖数据和不具有长远的预测性 对于问题2,我们提出了[微分差分方程组合模型[2]基于低通滤波理论的系统控制模型 3基于神经网络的系统模型|4基于分支过程( Branching process))的 Monte carlo仿真模型 四种具有不同核心思想的模型。模型1既体现了传染病的通性,又反映了SARS病征的特征; 模型2,我们基于“低通滤波器”的核心思想,引入了一个“有效控制函数”模拟实际过程中 政府、医疗机枃的措施作用效果,通过解析求解我们得出了北京SARS持续期为99天及“控制 时间越早越好”、“SARS传染病不可能周期性复发”等结论,并对影响最终控制天数的四个变 化参量进行了具体的灵敏度分析;模型3里我们利用神经网络的方法对SARS传染病的发展趋 势进行预测,准确率高达92.9%;模型4中主要是利用了分支过程的思想对SARS进行了计算 机模拟 对于问题3,我们利用多项式拟合预测出了没有SARS影响下2003年各月的海外旅游人数, 并以此数据为基础,对比2003年已给出的前8个月的实际统计数据,发现SARS对旅游业的影 响具有“后效性”,于是,我们运用经济学中“效用函数”的思想,提出了“旅游人次影响模型”, 并引入了三个不同的影响函数。我们大胆预测SARS对北京市2003年海外旅游人次的影响是: 少接待海外游客138.211万人次。进一步对预测产生的误差进行了分析。 最后,我们给出了发表到报刊上的短文。 关键词:低通滤波有效控制函数神经网络分支过程 Monte carlo随机模拟 后效性 问题重述]
1 SARS 传播的研究 [摘要] 本文通过对所得的疫区患者日志数据进行计算机分析,拟合出了 SARS 不同阶段的趋势曲 线,结合题目所给的模型,对它提出的半模拟循环计算的方法进行了检验,得出该模型的优点 在于形式简单,模拟的精确度较高,k 值的改变体现出了其合理性,同时指出了它的主要缺点 在于过分依赖数据和不具有长远的预测性。 对于问题 2,我们提出了[1] 微分差分方程组合模型[2] 基于低通滤波理论的系统控制模型 [3] 基于神经网络的系统模型[4] 基于分支过程(Branching Process)的 Monte Carlo 仿真模型 四种具有不同核心思想的模型。模型 1 既体现了传染病的通性,又反映了 SARS 病征的特征; 模型 2,我们基于“低通滤波器”的核心思想,引入了一个“有效控制函数”模拟实际过程中 政府、医疗机构的措施作用效果,通过解析求解我们得出了北京 SARS 持续期为 99 天及“控制 时间越早越好”、“ SARS 传染病不可能周期性复发”等结论,并对影响最终控制天数的四个变 化参量进行了具体的灵敏度分析;模型 3 里我们利用神经网络的方法对 SARS 传染病的发展趋 势进行预测,准确率高达 92.9%;模型 4 中主要是利用了分支过程的思想对 SARS 进行了计算 机模拟。 对于问题 3,我们利用多项式拟合预测出了没有 SARS 影响下 2003 年各月的海外旅游人数, 并以此数据为基础,对比 2003 年已给出的前 8 个月的实际统计数据,发现 SARS 对旅游业的影 响具有“后效性”,于是,我们运用经济学中“效用函数”的思想,提出了“旅游人次影响模型”, 并引入了三个不同的影响函数。我们大胆预测 SARS 对北京市 2003 年海外旅游人次的影响是: 少接待海外游客 138.211 万人次。进一步对预测产生的误差进行了分析。 最后,我们给出了发表到报刊上的短文。 关键词: 低通滤波 有效控制函数 神经网络 分支过程 Monte Carlo 随机模拟 后效性 [问题重述]
SARS( Severe Acute Respiratory Syndrome,严重急性呼吸道综合症,俗称:非典型肺炎) 是21世纪第一个在世界范围内传播的传染病。SARS的爆发和蔓延给我国的经济发展和人民生 活带来了很大影响,我们从中得到了许多重要的经验和教训,认识到定量地研究传染病的传播 规律、为预测和控制传染病蔓延创造条件的重要性。请你们对SARS的传播建立数学模型,具 体要求如下: (1)对附件1所提供的一个早期的模型,评价其合理性和实用性。 (2)建立你们自己的模型,说明为什么优于附件1中的模型;特别要说明怎样才能建立一个 真正能够预测以及能为预防和控制提供可靠、足够的信息的模型,这样做的困难在哪里?对于 卫生部门所采取的措施做出评论,如:提前或延后5天采取严格的隔离措施,对疫情传播所造 成的影响做出估计。附件2提供的数据供参考。 (3)收集SARS对经济某个方面影响的数据,建立相应的数学模型并进行预测。附件3提供 的数据供参考。 (4)给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性。 问题分析 在SARS爆发的初期,由于潜伏期的存在,社会对病SARS毒传播的速度和危害程度认 识不够,所以政府和公众并不以为然;当人们发现被感染者不断增加时,政府开始采取多种措 施以控制SARS的进一步蔓延所以SARS的传播规律可以分为三个阶段: I)快速蔓延期:在此期间SARS成自然转播的态势; 2)高潮期:在此阶段患者数一直居高不下 3)控制期:在我们引入了各种措施影响后的转播模式。 在建立模型求解问题时,我们需要把握好三种阶段的不同特性,抓住主要及合理的因素建 模 [模型假设] 1.人群分为易感人群(健康者),传染者,隔离者,康复者,死亡者五大类。 2.人群中任何两人的接触是相互独立的,且具有相同的概率。当健康人与患者接触时,有 定的概率被感染上,且此病有一定的治愈率与死亡率 3.SARS患者康复后具有免疫能力,治愈后没有被感染的可能。 4.在0时刻时,该疫区已经发现l名患者。 5.不考虑该地区的自然死亡率与出生率对总人口数产生的影响及人口流动的影响 [符号说明] N():在某时刻此传染系统内的总人口数。 λ:自由传播源平均每天造成的感染率 u:为该病平均每天的治愈率。 δ:患者平均每天的死亡率
2 SARS(Severe Acute Respiratory Syndrome,严重急性呼吸道综合症, 俗称:非典型肺炎) 是 21 世纪第一个在世界范围内传播的传染病。SARS 的爆发和蔓延给我国的经济发展和人民生 活带来了很大影响,我们从中得到了许多重要的经验和教训,认识到定量地研究传染病的传播 规律、为预测和控制传染病蔓延创造条件的重要性。请你们对 SARS 的传播建立数学模型,具 体要求如下: (1)对附件 1 所提供的一个早期的模型,评价其合理性和实用性。 (2)建立你们自己的模型,说明为什么优于附件 1 中的模型;特别要说明怎样才能建立一个 真正能够预测以及能为预防和控制提供可靠、足够的信息的模型,这样做的困难在哪里?对于 卫生部门所采取的措施做出评论,如:提前或延后 5 天采取严格的隔离措施,对疫情传播所造 成的影响做出估计。附件 2 提供的数据供参考。 (3)收集 SARS 对经济某个方面影响的数据,建立相应的数学模型并进行预测。附件 3 提供 的数据供参考。 (4)给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性。 [问题分析] 在 SARS 爆发的初期, 由于潜伏期的存在, 社会对病 SARS 毒传播的速度和危害程度认 识不够, 所以政府和公众并不以为然; 当人们发现被感染者不断增加时, 政府开始采取多种措 施以控制 SARS 的进一步蔓延.所以 SARS 的传播规律可以分为三个阶段: 1) 快速蔓延期:在此期间 SARS 成自然转播的态势; 2) 高潮期:在此阶段患者数一直居高不下; 3) 控制期:在我们引入了各种措施影响后的转播模式。 在建立模型求解问题时,我们需要把握好三种阶段的不同特性,抓住主要及合理的因素建 模。 [模型假设] 1.人群分为易感人群(健康者),传染者,隔离者,康复者,死亡者五大类。 2.人群中任何两人的接触是相互独立的,且具有相同的概率。当健康人与患者接触时,有一 定的概率被感染上,且此病有一定的治愈率与死亡率。 3.SARS 患者康复后具有免疫能力,治愈后没有被感染的可能。 4.在 0 时刻时,该疫区已经发现 0 I 名患者。 5.不考虑该地区的自然死亡率与出生率对总人口数产生的影响及人口流动的影响。 [符号说明] N(t) : 在某时刻此传染系统内的总人口数。 λ :自由传播源平均每天造成的感染率。 µ :为该病平均每天的治愈率。 δ :患者平均每天的死亡率
t:当疫情蔓延到一定程度后,政府等机构采取措施的起始时间。即:控制起始时间 h1:感染SARS病的患者的潜伏期。(即:此时他不具有传染能力,且没有症状)。 h2:被视为疑似病例的人的隔离期。 E(1):处于潜伏期的患者。(非传染源) f(1):过了潜伏期,表现出症状,但还未隔离的患者数。(自由传染源) ():t时刻传染源的总数 DP():t时刻疑似病例的人数。 CP():t时刻确诊病人的人数 R():t时刻的退出传染系统的人数(包括康复者、死亡者) S():t时刻的健康人数(易感染人群,不包括患病后治愈的) B1:疑似病例中每日被排除的人数占疑似病例的比例 B2:疑似病例中每日转化为确诊病人占疑似病例的比例 a:被自由传染源有效感染的人中的可控系数: 其它符号使用时再予说明。 [模型建立及求解] 对问题1的回答 1.合理性 由附件1所给出的模型N()=N(l+K 它是基于现实中的自然状态,描述出了SARS传染病最核心最本质的变化趋势,第t天增 加的病人数目正比于初始的传染源基数M,与变化参量K和经历的天数t成指数率关系。不同 的是,为了说明社会各界以及政府等方面所加入的控制措施对产生的影响,它的K的取值不是 定值,而是在(-1≤K≤1)范围内变化。具体的K值的取定需要分段拟合实际疫情发展提供 的有效数据确定,由题目中所给的半模拟循环计算方法,从疫情发展初期到高潮再到相对平稳 期的过程中,拟合所得的K值在初期可认为是定值,接近高潮期时逐步减小的,客观准确地反
3 : 0t 当疫情蔓延到一定程度后,政府等机构采取措施的起始时间。即:控制起始时间。 : 1 h 感染 SARS 病的患者的潜伏期。(即:此时他不具有传染能力,且没有症状)。 : 2 h 被视为疑似病例的人的隔离期。 E(t) :处于潜伏期的患者。(非传染源) M (t) : 过了潜伏期,表现出症状,但还未隔离的患者数。(自由传染源) I(t) :t 时刻传染源的总数。 DP(t) :t 时刻疑似病例的人数。 CP(t):t 时刻确诊病人的人数。 R(t) :t 时刻的退出传染系统的人数(包括康复者、死亡者) S(t) :t 时刻的健康人数(易感染人群,不包括患病后治愈的) : β1 疑似病例中每日被排除的人数占疑似病例的比例 : β 2 疑似病例中每日转化为确诊病人占疑似病例的比例 α :被自由传染源有效感染的人中的可控系数; 其它符号使用时再予说明。 [模型建立及求解] 对问题 1 的回答 1.合理性: 由附件 1 所给出的模型 N(t)= N0 (1+K) t 它是基于现实中的自然状态,描述出了 SARS 传染病最核心最本质的变化趋势,第 t 天增 加的病人数目正比于初始的传染源基数 N0 ,与变化参量 K 和经历的天数 t 成指数率关系。不同 的是,为了说明社会各界以及政府等方面所加入的控制措施对产生的影响,它的 K 的取值不是 定值,而是在(−1 ≤ K ≤ 1)范围内变化。具体的 K 值的取定需要分段拟合实际疫情发展提供 的有效数据确定,由题目中所给的半模拟循环计算方法,从疫情发展初期到高潮再到相对平稳 期的过程中,拟合所得的 K 值在初期可认为是定值,接近高潮期时逐步减小的,客观准确地反
映出当疫情刚刚产生时,由于全社会缺乏了解,警觉性差,没有得当措施,造成疫情的大面积 快速蔓延,K值相对较大,而发展到一定程度时,全社会警惕性提髙,政府公众采取一系列有 利措施控制事态的发展,从而使K值逐渐变小。并且,该模型的优点在于简单,易行,方便对 数据采用拟合处理和利用取对数求方差估计与实际数据的误差,说明了该模型所具有的合理性。 合理性证明:利用所给的北京数据,拟合出三组K(初始时的值分别为 k1=1.13913,k2=1.12913k3=1.11913)值按照某一值固定不变引起的发展趋势和三组K值根据分 段时间拟合改变数值所引起的发展趋势对比图:(蓝点表示实际北京累计人数的变化趋势,红 点表示拟合变化趋势) mmmmm 408 46810 K值始终不变 K值拟合变化 从对比图看,题目中K值在过程中变化的思想是重要的,也是正确的 2.实用性 任何具有传染性的疾病大致都是会经历“发展(快速蔓延)期→相对稳定期_酾→逐 渐消亡期”这样的一个过程,利用N()=No(1+k 形式的模型根据不同的的K值的取值(-1≤K≤1),都可以模拟上述过程。因此它具有普遍实 用性。 3.模型的缺陷: 此模型把实际问题过于简单化了,有不合理的地方 (1).模型中的K的取值没有一个度量的标准,它只能根据已经有的数据拟合,取满足符合现 实的K值,因此它的模型的精确度严重地依赖与所给数据的准确度。实际中,统计所给的数据 本身就有一定误差,拟合一个本身就包含偏差的数据势必造成与现实规律更大的背离。按照题 目的模型和算法思想,我们以“北京日志”的数据进行了验证:(黑线表示实际北京数据的变化 趋势,红线为其拟合的变化趋势曲线)
4 映出当疫情刚刚产生时,由于全社会缺乏了解,警觉性差,没有得当措施,造成疫情的大面积 快速蔓延,K 值相对较大,而发展到一定程度时,全社会警惕性提高,政府公众采取一系列有 利措施控制事态的发展,从而使 K 值逐渐变小。并且,该模型的优点在于简单,易行,方便对 数据采用拟合处理和利用取对数求方差估计与实际数据的误差,说明了该模型所具有的合理性。 合理性证明 :利用所给的北京数据,拟合出三组 K (初始时的值分别为: k1=1.13913,k2=1.12913,k3=1.11913)值按照某一值固定不变引起的发展趋势和三组 K 值根据分 段时间拟合改变数值所引起的发展趋势对比图:(蓝点表示实际北京累计人数的变化趋势,红 点表示拟合变化趋势) 20 40 60 80 100 1000 2000 3000 4000 5000 6000 20 40 60 80 100 500 1000 1500 2000 2500 K 值始终不变 K 值拟合变化 从对比图看,题目中 K 值在过程中变化的思想是重要的,也是正确的。 2.实用性: 任何具有传染性的疾病大致都是会经历“发展(快速蔓延)期→相对稳定期 高潮→ 逐 渐消亡期”这样的一个过程,利用 N(t)= N0 (1+K) t 形式的模型根据不同的的 K 值的取值(−1 ≤ K ≤ 1),都可以模拟上述过程。因此它具有普遍实 用性。 3.模型的缺陷: 此模型把实际问题过于简单化了,有不合理的地方: (1).模型中的 K 的取值没有一个度量的标准,它只能根据已经有的数据拟合,取满足符合现 实的 K 值,因此它的模型的精确度严重地依赖与所给数据的准确度。实际中,统计所给的数据 本身就有一定误差,拟合一个本身就包含偏差的数据势必造成与现实规律更大的背离。按照题 目的模型和算法思想,我们以“北京日志”的数据进行了验证:(黑线表示实际北京数据的变化 趋势,红线为其拟合的变化趋势曲线)
102304050 (新增人数的变化趋势) (累计人数的变化趋势) 不论是对于累计人数还是新增人数,模型只能给出接近的前期发展趋势,与实际曲线有相当误 差,从而可以看出模型本身的不完整性。 (2).模型本身不具有预测性,它的K值是由数据拟合决定的。如果背离题目本意,我们让K 按照某种规律变化,预测发展趋势,其产生的误差是很大的 (3).由左图可以看出,模型本身是基于现实自然发 展状态,在发病初期与客观情况的一致性较好,而随着 0 时间的推移,存在各种控制的综合作用,K值的变化已 很难刻画出复杂因素的影响,使模型的一致性变差,误 差越来越大。 4).用一个单纯笼统的K就要模拟现实中的各种因 素对SARS的影响,是十分不合常理,因为各种因素对 SARS的影响不尽相同,有的可能抑制传播,有的则可能 促进流行,因此,至少应设为某种函数形式,引入一些 10203040500参量因子进行考虑 (5).此模型单单刻画出了传染病的一般性,那么SARS 和其它的传染病也就没什么本质上的区别了,缺乏对其SARS的特征进行具体深入分析。 由此我们考虑建立以下模型 对问题2的回答 模型一:微分差分方程组合模型 我们基于微分方程的思想,把整个社会看成一个系统,在SARS流行期间,死亡的人,已经 康复的患者(不再可能再次感染)就看成是已经退出了系统。而对于被隔离起来的患者和疑似 病人也不再具有传染能力,也就不再是传染源。并且,我们将政府等方面采取的措施融合在了 起,体现于方程的各等量关系中,于是我们提出这个模型 据资料,SARS潜伏期的患者不具有传染性,则:I()=M()
5 10 20 30 40 50 60 20 40 60 80 100 120 140 10 20 30 40 50 60 500 1000 1500 2000 2500 (新增人数的变化趋势) (累计人数的变化趋势) 不论是对于累计人数还是新增人数,模型只能给出接近的前期发展趋势,与实际曲线有相当误 差,从而可以看出模型本身的不完整性。 (2). 模型本身不具有预测性,它的 K 值是由数据拟合决定的。如果背离题目本意,我们让 K 按照某种规律变化,预测发展趋势,其产生的误差是很大的。 (3). 由左图可以看出,模型本身是基于现实自然发 展状态,在发病初期与客观情况的一致性较好,而随着 时间的推移,存在各种控制的综合作用,K 值的变化已 很难刻画出复杂因素的影响,使模型的一致性变差,误 差越来越大。 (4). 用一个单纯笼统的 K 就要模拟现实中的各种因 素对 SARS 的影响,是十分不合常理,因为各种因素对 SARS 的影响不尽相同,有的可能抑制传播,有的则可能 促进流行,因此,至少应设为某种函数形式,引入一些 参量因子进行考虑 (5).此模型单单刻画出了传染病的一般性,那么 SARS 和其它的传染病也就没什么本质上的区别了,缺乏对其 SARS 的特征进行具体深入分析。 由此我们考虑建立以下模型。 对问题 2 的回答 模型一:微分差分方程组合模型 我们基于微分方程的思想,把整个社会看成一个系统,在 SARS 流行期间,死亡的人,已经 康复的患者(不再可能再次感染)就看成是已经退出了系统。而对于被隔离起来的患者和疑似 病人也不再具有传染能力,也就不再是传染源。并且,我们将政府等方面采取的措施融合在了 一起,体现于方程的各等量关系中,于是我们提出这个模型: 据资料,SARS 潜伏期的患者不具有传染性,则: I(t) = M (t) 10 20 30 40 50 60 500 1000 1500 2000 2500 3000