武汉市2019年12月起爆发不明原因肺炎疫情,病原体初判为新型冠状病毒,联合国世界卫生组织(WHO)已命名为2019-nCoV(2019新型冠状病毒)。中国宣布新型冠状病毒感染的肺炎暂命名为“新型冠状病毒肺炎”,简称“新冠肺炎”,英文名为“Novel Coronavirus Pneumonia”(简称NCP)。

3601430574.jpg

冠状病毒的流行何时会达到高峰以及缓解?很难预测,但是研究人员使用统计和数学模型来尝试了解和预测疫情的进展,他们包括医学、生物学及数据学专家。以下介绍通过搜索趋势大数据和使用R语言进行Logistic回归分析的应对 2019-nCoV 疫情的数据科学预测结果。

中国科学报2月3日——大数据预测:新型冠状病毒肺炎拐点已到?

近日,中山大学数据科学与计算机学院副教授胡延庆与博士后谢家荣、博士生孙嘉辰等人利用百度、Google等大众搜索趋势大数据,通过具有控制干预机制的流行病SEIR(易感-潜伏-感染-隔离)传染模型,构建了对近期国内爆发的新型冠状病毒肺炎传染趋势进行了预测。其预测结果表明,最近2到4天内,每日新增加确诊人数将会迅速下降。

数学模型把新型冠状病毒肺炎传播过程分成两个阶段:在第一阶段,由于群众对疾病具体情况不知情,对疫情的认知程度有限,导致对疾病传播缺乏有效的防备措施。在此阶段下,研究人员根据新型冠状病毒肺炎传播特点,认为符合基本再生数为常数SIER 模型(易感-感染-潜伏-隔离);在第二阶段,由于政府和人们高度重视,和对疾病传播途径已有较为准确的认知,人群会逐渐采取有效且科学的防控措施,使得基本再生数不断下降,直到下降到小于1以下,并持续一段时间,达到对疾病的根除。

预测趋势图显示:

2808567060.jpg

部分省份及城市的日新增确诊人数,可见在2月1号左右已经出现拐点。更重要的是,日增长确诊人数基本线性的,这意味着全国各地,对春节前夕从武汉流出的感染者的防控从一开始就是有效的。

莱茵数据在线Logistic回归分析

莱茵数据在线团队(根据About显示,这是一个R语言数据团队)利用Logistic回归和各地已经公布的数据做了统计回归,预测了各个省级行政区的疫情增长情况,给出了各地疫情明显缓和的日期。

unnamed-chunk-3-1.png
基于全国数据的Logistics拟合

Logistic 回归,译作对数几率回归或者罗吉斯回归,是一种对数几率模型,是离散选择法模型之一,是生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析中最常用的方法之一。获得结果尽管不能尽善尽美,但参考价值很高。

各地疫情缓和时间预测:
3951473721.jpg


本文由 cds 整理发布,参考 CC-BY-SA 3.0 协议共享,欢迎转载、引用或改编。
感谢您的支持,以让我们持续关注中国学子的STEAM旅程!

还不快抢沙发

添加新评论