建模预测在传染病方面的应用及意义

(整期优先)网络出版时间:2021-01-05
/ 4

建模预测在传染病方面的应用及意义

杨子豪 刘奕 张雨欣 刘滟

(南京审计大学,江苏南京)


摘要:传染病的爆发往往容易造成社会恐慌,严重危害人们的生命健康。通过建立数学模型,利用已有的传染病数据对传染病的传播方式进行分析研究对社会稳定和疾病本身都具有重要的意义。此次新冠状病毒疫情可以利用SIR模型来进行拐点和高峰疫情人数等的预测。而且传染病模型本身并不仅仅适用于某几种传染病预测,也可以推广应用到与传染病传播方式具有共性的其他社会问题中。


关键词:建模;传染病;预测;应用。


Key words: modeling; infectious diseases; prediction; application.


  1. 传染病介绍

传染病是一种能够在人与人之间或人与动物之间相互传播并广泛流行的疾病,通过建立数学模型,可获知传染病的传播过程以及可能感染此传染病的人数等。本文的研究目的是希望了解各种常用传染病模型和预测模型以及这些模型在传染病方面的应用方法及意义,并通过构建统计模型,针对新冠疫情的数据实现估计与预测。

新冠肺炎疫情逐渐蔓延至全世界,成为当前人们最关心,热度最高的的话题。传染病的爆发不仅危害着人们的生命健康,也对社会经济等形成了巨大冲击。因此传染病的发展方向以及对应实施的防控措施都是值得深入研究的。

构建数学模型对于传染病进行预测早在SARAS甚至更早以前就出现了,并且取得很好的效果。通过模型可以预测和估计出疾病爆发的可能性、拐点出现的时刻以及可能感染的人数。这不仅有利于提高人们对传染病的重视程度从而加强重视自身防护,也有助于相关部门制定相关防控政策。

截止至2020年6月5日,湖北省已累计确诊新冠肺炎患者68134人,广东省1395人,河南省1273人,浙江省1218人,多省启动突发公共卫生安全事件一级响应。在对病毒暂时不能完全了解、感染范围不断扩大的情况下,预测估计传染病的发展态势是最为直接有效的方法。通过模型针对已有数据进行预测,方便对可能成为重点疫区的省市采取更严格的防控措施。因此,为了保证能对传染病有有效预测,需要积极探索建立模型的方法,加强对不同数据的应用能力,最大限度降低预测误差率,为社会公共卫生安全作出贡献。通过建立预测模型,可以预测估计传染病持续时间,拐点的到达,感染者人数等问题。因此,借助数学模型强大功能,预测传染病的发展方向,帮助制定有效的防控手段,是一项具有普遍现实意义的工作。

在传染病研究领域以外,也有社会和自然科学领域的问题需要模型参与解决。因此建立传染病预测模型的意义除了能够快速有效控制疫情、维护社会稳定以外,也可以将模型应用到与传染病有相似传播方式的其他领域中例如网络信息传播等。



  1. SIR模型对新冠疫情的预测

2019年年底新冠肺炎疫情先在武汉爆发,继而传播到全国,是继非典之后又一个全国性病毒传播。SIR模型(Susceptible Infected Recovered Model)是常用的传染病模型,用此模型对传染病传播的过程进行分析具有一定参考意义。

我们从湖北卫生健康委员会公布的数据中选取2020年1月28日至2020年6月5日的数据,包括每天的确诊人数、治愈人数和死亡人数。人数随时间变化如图所示。

5ff42ee9dc590_html_a5b5f5d2754b8a32.png

图表 1

从图中可以直观看出确诊人数(排除确诊后治愈的人数)从1月28日的3554人到2月20日达到峰值52554人,共历时22天。

考虑现实情况如湖北大部分城市在1月28日已经封城即新冠肺炎死亡率较低的特点提出以下几个模型假设:

1.不考虑湖北人口的出生、死亡以及流进流出,即湖北的总人口不变。

2.感染后又被治愈的人不会再次感染。

3.单位时间内感染人群5ff42ee9dc590_html_cd4bbebe1c14290.gif 所能感染的人数与易感人群5ff42ee9dc590_html_d71903ab227171e4.gif 成正比,比例系数为5ff42ee9dc590_html_d3948049c8bcd560.gif ,则单位时间感染的人数为5ff42ee9dc590_html_e4b923fb763969ea.gif .

4. 单位时间内恢复人群与感染人群5ff42ee9dc590_html_cd4bbebe1c14290.gif 成正比,比例系数为γ,单位时间恢复的病人数为5ff42ee9dc590_html_2c37c90309ac628d.gif


设单位时间内的易感人群表示为 5ff42ee9dc590_html_d71903ab227171e4.gif ,感染人群为5ff42ee9dc590_html_cd4bbebe1c14290.gif ,恢复人群为5ff42ee9dc590_html_286fb66dcb42fff0.gif ,则可得到如下微分方程。

5ff42ee9dc590_html_ff62b88c795e8f3c.gif


该方程属于高度耦合的非线性类型,要得到解析解并不容易,可借助python求其数值解进行分析和预测,预测的关键在于感染系数5ff42ee9dc590_html_d3948049c8bcd560.gif 与恢复系数γ的取值。可利用搜集的数据进行估计。

考虑到对确诊人群的隔离、湖北各城市的封锁,且群众应政策要求滞留家中,当下的环境并不是一个感染人群和普通群众充分混合的环境。故不能使用湖北人口数作为人口总量进行预测,需要估计易感人群初值5ff42ee9dc590_html_e2e4cb4ca5f6b455.gif .

从微分方程中可以看出恢复系数γ可由感染人群5ff42ee9dc590_html_cd4bbebe1c14290.gif 和恢复人群5ff42ee9dc590_html_286fb66dcb42fff0.gif 的数据计算得到,而感染人群和恢复人群可以由观测到的数据直接给出。根据图表1确诊人数得到峰值的天数,将此次病毒性肺炎恢复周期估计为22天,恢复系数γ≈1/22.

对于易感人群初值5ff42ee9dc590_html_e2e4cb4ca5f6b455.gif 和感染系数5ff42ee9dc590_html_d3948049c8bcd560.gif 的估计采用最小二乘估计的方法,即先估计

5ff42ee9dc590_html_e2e4cb4ca5f6b455.gif5ff42ee9dc590_html_d3948049c8bcd560.gif 的取值区间,然后寻找区间内计算得到预测值与真实值残差平方和最小的一组值作为估计值进行预测。我们遍历的5ff42ee9dc590_html_e2e4cb4ca5f6b455.gif 区间为[10000,100000].对于每一次遍历,

5ff42ee9dc590_html_98645c07da80e18d.gif


Python运行的结果为5ff42ee9dc590_html_c49cc103030aa3d1.gif5ff42ee9dc590_html_c450f67f2e8fa20d.gif ,此时残差最小。

5ff42ee9dc590_html_a5b5f5d2754b8a32.png

图表 2

从图2中可以看出,记录起始点6天后到达拐点,感染人数增长率放缓;19天后到达峰值,达到48678人左右。

5ff42ee9dc590_html_1d315981065dea58.png

图表 3


可以看出预测感染人数与实际确诊人数存在一定差异,模型的局限性在于:

1.未考虑新型冠状病毒肺炎的潜伏期,与非典型肺炎相比,本次蔓延的病毒有更长的潜伏期,不易察觉;

2.未考虑二次感染人数,实际上有已经治愈后仍然感染的例子。

3.未能根据已有数据很好地估计恢复系数,用更详实的数据或其他更好的方法估计恢复系数应是改进预测的一大思路;

4.真实的感染人数不等同于当日的确诊人数,当日的疑似症状病人数应有部分感染,且不可避免地存在漏报甚至瞒报等情况,实际的感染人数是不可观测的。

由于前6天的拟合情况较好,我们可以利用此模型对1月28日之前的疫情进行回溯分析,可以得出2019年12月27日疫情就已经在一定范围内传播,与实际情况相符。

通过利用 SIR 模型对实际疫情数据的拟合,我们成功获得了疫情主要参数, 完整地拟合了疫情的发展趋势。达到拐点的时间和疫情高峰人数都较为吻合。这些结果表明,本文对SIR微分方程的参数计算方法和累积的实际数据可以较准确地预测疫情走势,为疫情防控提供可靠的科学依据。对于研究疫情后期的控制方案有重要参考意义。基于简单的 SIR 模型对这次武汉新花冠病毒的传播规律进行了回溯分析结果表明,再次确认 SIR 模型在传染病扩散模式预测上是可靠的。 这一模型和方法能够获得较为可靠地确定病毒感染特征数据,为制定今后的疫情干预决策提供数据支持,保证社会和医疗资源配置的最大效益。



  1. 建模预测对传染病防治的意义

(一)数学模型在疫情初期的应用

传染病的爆发不仅对人类健康,而且对经济发展和社会稳定都会造成巨大威胁。为高效防控各种传染病,许多数学家和流行病专家通常会在疫情出现初期利用其专业视角,通过数学建模的方式分析疫情发展状况及病毒传播规律,以达到防控疫情的目的。

1、作出预警、采取防控措施

数学模型是分析处理传染病传播规律的最有力工具,主要体现在在缺乏大量优质数据的疫情初期,专家需要通过仅有的数据对疫情情况进行分析作出预警,及时采取防控措施,以减少感染人数。一个模型的建成不仅是专家们单凭数据就可以实现的,往往需要了解流行病本身的特征及政府、个人的举措,结合不断扩充的流行病学、人口迁移和公共卫生防疫政策数据库来构建模型[1]

以新冠疫情为例,2019年12月27日,湖北省武汉市检测发现不明原因的肺炎病例,中国第一时间报告疫情,采取行动,开展病因学和流行学的调查[2]。但由于对新冠病毒的临床实验经验的缺乏,医疗专家无法提出针对性的解决措施,因而专家只能依赖数学统计模型对新冠疫情进行模拟预测。据分析,在对疫情数据完成线性模型相关性检验之后发现,武汉封城政策使得疫情发展的进程减慢了三天,减缓了疫情在中国的全面扩散。同时流行病专家针对当时情况建立的动态数学模型计算得出中国的防疫措施政策使得减少了数十万的新冠病例。至此,数学模型在新冠疫情的发展中起到了初步分析、总结经验、采取措施、减少感染人数的作用。


2、评估疫情规模、采取适宜措施

对于各种传染病而言,数学模型的存在往往可以在传染病出现且发展的过程中,即时预测疫情规模,以采取相应的防控措施。以新冠、SARS、MERS为大规模疫情的传染病为例,其传播过程往往包含着超级传播者——在数学模型中体现为病患将病毒传播给更多的人。数学上认为,自然情况下一个患者平均能把病毒传播感染的人数给定,超级传播者越多,由于个体间的差异导致被传播的人数较少,因而这种流行病规模较小但更具有爆发性[3]

对于每一次突发的传染病而言,对仅有的数据进行识别和处理,接着对人口死亡率进行统计模型的估计,即可预测大流行病早期某一特定人口死亡阈值的时间,进而预测疫情规模。在有理论数据支持的条件下,政府可以对不同疫情的地区进行区别防控。对于那些爆发严重且传播广泛的地区,即可采取紧急措施;对于疫情较为稳定的地区,可以在从严的基础上适当调整防控措施,进而实现分地防控,在有限的资源的条件下更高效地防控疫情。


3、估算医疗资源的紧张程度

快速可靠地评估流行病原体的临床严重程度是防疫的重要举措,特别是对感染者死亡率和发病者死亡率的评估依赖于对疫情规模的准确估计。在传染病传播的过程中,发现的病例数必然会受到感染发病率,就医、和检测能力的影响。通过建立流行病传播模型来分析所有的流行病数据与临床数据可以解决部分偏差。

当发生大规模传染病爆发突发事件时,医疗救援尤为重要,如何及时有效地估算医疗资源的紧张程度以实现对医疗急救资源的合理配置是面对传染病爆发时的重大问题。以2020年湖北武汉出现的新冠肺炎为例,疫情爆发初期,武汉市内,各医院发热门诊人满为患、识别确诊时间长、病床紧缺、不能及时收治患者等问题突出。在面对该类大型公共卫生事件时,国内基基层医疗设备存在严重欠缺。而新冠疫情的爆发直接暴露了国内医疗供给总量不足和分配不均的短板。所以,利用数学模型估算医疗资源的紧张程度,以便及时调配全国人力、物力资源驰援武汉,以缓解武汉的医疗资源紧张程度是必不可少的举措。通过数学模型对医疗资源的紧张程度的估算,在有理论依据和实际情况的支持下,国家政府从全国各地紧急统一协调,能够缓解医疗防护物资紧张和生产供应跟不上的问题。

(二)数学模型对传染病未来发展趋势的应用

1、对传染病发展中增长趋势的预测

研究传染病模型,根据已有的传染病数据,对传染病发生后的病情情况进行分析;对比已有类似传染病模型和当前所建立的传染病模型,定量评价当前传染病模型的建立是否具有良好效果,评估其有效性,对现有社会舆论和潜在社会舆论进行理论指导控制。对传染病发展过程中增长趋势的有效预测,是尽早结束传染病的重要举措,对传染病动力学的研究具有重要的补充意义。

在传染病传播发展阶段,前期进行有效控制,现阶段的增长趋势可以结合已有模型采取“早发现、早隔离、早治疗”措施,及时降低感染率,对下一阶段传染情况作出适当预测,根据病毒研究情况进行药物治疗,预估增长的缓急情况,通过线上、线下媒体的官方报道,正确引领社会舆论互动的发展导向,使不符合事实的谣言终止在可控范围之内,使社会人群对传染病重大事件的关注点始终保持在正确的聚焦点上[4]


2、对拐点及病原体变异等问题的预测

传染病模型的建立,可以对当前传染病的发展拐点进行预测。所有的感染都会有情况转好下降的过程,疫情拐点是指疫情得到有效控制,病情从坏的一方开始向好的一方转变的点。通过建立数学模型拟合当前传染病的累计发病人数,来推测发病高峰,使相关研究人员更好的掌控传染病的动态走势。虽然拐点的预测不是精准的,但拐点的预估出现,会让人们充满信心更好地应对当前传染病的发生,对病情的好转充满殷切的期望。

传染病模型的建立,可以对病原体的变异进行预测。结合已有的病原体变异规律,对未知变异做好应对措施和准备,相关传染病研究人员对传染源进一步观察,使所有在防治一线的工作人员增强自我保护的意识,通过正式传播平台使患病者和易患人群提高对传染病的重视程度,社会人群增强自我保护、提高免疫力的意识,在传染病发生时期,时刻保持警惕。


3、理论指导未来传染病的防治决策并提高我国传染病防治水平

掌握预测模型对传染病的应用和意义,可以为制订未来的疫情干预决策提供一定的理论支持。从理论实践上指导了疫情期间各种防疫举措的可实施性,对于很多不可控性不确定性因素拥有基础的心理建设和应对措施,并对未来的传染病具有前瞻性作用[5]

建立传染病模型,获知其拐点等疫情减缓的大致时间点,使各产各业逐步有效地恢复运作,积极利用通讯和社交媒体大力宣传对传染病的防治,在更短的时间内有效地完成各服务业的恢复。一定程度上减少人们由于传染病造成的经济生活的影响,提高我国在突发性公共卫生事件的解决处理能力,全面提升我国相关传染病诊段和防治的整体水平,突显我国的社会进步、技术发展水平和卫生保障水平的高能力水平[6]



四、传染病模型的推广应用

传染病模型在预测传染病领域以外还有丰富的应用,例如本文预测新冠病毒传播采用的SIR模型在投资金融和社交信息传播方面也有很好的适用性。由于传染病模型的种类较多,本文仅选择SIR模型的两个主要应用领域进行讨论。


  1. 在投资者行为研究中的应用

理性人假设是西方经济学中最基本的假设,也就是所有的市场投资者追求的都是以最小的成本获得最大的收益。在理性人假设的基础上,各种投资行为和经济现象才可以被分析与解读。然而非理性行为在投资过程中是必然会出现的,这也是行为金融理论产生的一个原因。

首先,投资者并不能充分获得市场上的所有信息,且对于大多数非标准金融投资者而言,有限的市场信息并不能被有效充分的加工;其次,由于投资者所持资本、投资观念、个性气质等的不同,会出现风险偏好型、风险中立型和风险厌恶型三种类型的投资者,那么假设投资者面对具有不确定性市场信息的投资行为时,风险偏好者会选择参与投资,而风险厌恶者则可能会放弃套利机会[7]

对于大量缺乏专业投资知识的个人投资者而言,由于独立理性思考能力不足,投资的传染现象是广泛存在的,他们往往会受身边投资者行为和市场舆论的影响,从而改变自己的判断,最终造成一种“跟风”的现象。

在金融危机爆发时,也会出现一种传染现象。以2008年全球金融危机为例,由于美国房地产市场不景气,次级住房抵押贷款债券出现了大量违约现象。而资产证券化涉及发起人、特定目的机构或受托人等多方参与者其中一环出现问题就会引起连锁反应。在多重不利消息的笼罩下,投资者疯狂抛售股票,金融市场几乎瘫痪,出现流动性危机。最终金融机构资金链断裂,投资银行、商业银行纷纷破产,美国局部的次贷危机最终引发了全世界的金融危机,给全球经济带来了不可逆的损害,引发了世界经济大衰退。

以上两个事例都可以建立传染病模型中最经典的SIR模型来进行分析预测。在经济全球化的背景下,金融危机传染会对全球经济造成深刻影响。将合适的传染病模型拓展应用到投资者行为研究中可以最大程度减少经济损失,稳定金融市场。


  1. 在信息传播领域的应用

21世纪是信息通讯技术迅猛发展的时代,任何消息在网络上都以指数级速度传播。消息由社交平台的用户产生,用户的好友圈是消息最初的传播者,任何消息的接收者都会转化成消息传播者或停止传播成为移除者。出于正常考虑,人们往往希望好消息可以短时间内覆盖,而坏消息可以缓慢传播,降低对社会的影响程度

[8]

目前在网络上会对社会造成严重危害的主要是谣言传播,在虚拟空间里,消息接收者都是被动的,接收者只能通过自己的理性逻辑和消息发布者单方面描述来判断消息的真伪,因此错误判断不可避免,但当消息接收者将谣言判断为真实消息,那就极为可能转变成消息传播者。此外,还有另一种情形,人们总是有追求刺激和戏剧性的猎奇心理,消息在传播的过程中会因为这种“猎奇”而从真实客观消息转变为谣言进而开始指数级的传播。

谣言的控制,一方面需要增强网络世界参与者的责任意识,这是遏制谣言最有效最快速也是成本最低的方式;另一方面,自我的社会责任感是一种不可控因素,当谣言传播不可避免发生的时候,管理者必须将主动权掌握在自己手中,分析传播途径和传播速度,控制谣言的影响程度。在这样一个具有传播性的事件中,可以将所有的网络参与者记为N,已接收消息且具备传播可能性的参与者记为传播者i;未接收到消息且可能接收到消息的参与者记为易感者s,已接收消息但不再传播的参与者记为移除者r。

显然,根据网络信息传播的方式来看,它与SIR模型分析传染病问题的过程比较相似。社交网络信息是当今人们获取信息最关键的渠道,打造洁净的网络空间对一个国家、社会和个人而言都极为重要。因此,建立相关的数学模型来有效管控网络空间具有极大的意义。


参考文献:


[1]Tian Huaiyu, Liu Yonghong, Li Yidan, et al. An investigation of transmission control measures during the first 50 days of the COVID-19 epidemic in China.. 2020, 368(6491):638-642.

  1. 中华人民共和国国务院新闻办公室. 抗击新冠肺炎疫情的中国行动[N]. 人民日报,2020-06-08(010).

[3]Kucharski A J, Althaus C L. The role of superspreading in Middle East respiratory syndrome coronavirus (MERS-CoV) transmission.. 2015, 20(25):14-8.

[4]张佳. SIR模型及其在SARS疫情中的应用[D].山东大学,2019.:17-18.
[5]韩珂珂,邢子瑶,刘哲,刘峻明,张晓东.重大公共卫生事件中的舆情分析方法研究——以新冠肺炎疫情为例[J/OL].地球信息科学学报:1-10[2020-11-30].
[6]汤双振.试论传染病在我国疾病防治中的地位和意义[J].中国卫生事业管理,1993(07):366-367.

[7]刘珺. SIR模型及其在投资者行为研究中的应用[D].山东大学,2018:18-21.

[8]李可嘉,王义康.改进SIR模型在社交网络信息传播中的应用[J].电子科技,2013,26(08):168-171.