面向新冠疫情的数据可视化分析与模拟预测


导言

2019年在武汉爆发的新型冠状病毒肺炎(国家卫健委简称NCP)传播迅猛,已被世界卫生组织(WHO)定为“国际关注的突发公共卫生事件”。对疫情的控制,自1月24日武汉宣布封城之后,各个省市也陆续通过启动重大突发公共卫生事件一级响应来控制人口流动;同时,各省市医疗队伍驰援武汉,武汉的防控措施也急速加强;但全国疫情,特别是湖北省的状况依然让人揪心。公众非常关心疫情的发展趋势,期待“拐点”的出现;疫情防控部门希望不断总结经验教训,评估现有措施的有效性。该疫情的发展成为了涉及到我国政治经济民生的一件大事。

ca_wuhan_coronavirus_infraredthermometer_gettyimages.jpg

此次病毒的传播到底如何从武汉向外传播?不同省市疫情的发展呈现怎样的差别?封城、社区化隔离等一系列措施对减缓疾病传播起到了多大的作用;更为重要的是,拐点何时出现?

我们的报告首先从已有数据的可视化来展示疫情传播特点,然后通过建立传染病动力学模型,评估疫情防控措施,提出建议并预警,同时预测疫情疾病走势,给疫情防控决策和大众行为作为参考。


应对 2019-nCoV 疫情的数据科学预测


武汉市2019年12月起爆发不明原因肺炎疫情,病原体初判为新型冠状病毒,联合国世界卫生组织(WHO)已命名为2019-nCoV(2019新型冠状病毒)。中国宣布新型冠状病毒感染的肺炎暂命名为“新型冠状病毒肺炎”,简称“新冠肺炎”,英文名为“Novel Coronavirus Pneumonia”(简称NCP)。

3601430574.jpg

冠状病毒的流行何时会达到高峰以及缓解?很难预测,但是研究人员使用统计和数学模型来尝试了解和预测疫情的进展,他们包括医学、生物学及数据学专家。以下介绍通过搜索趋势大数据和使用R语言进行Logistic回归分析的应对 2019-nCoV 疫情的数据科学预测结果。


疫情拐点何时出现——基于数学模型的新冠病毒传播预测


前言

截止到2020年2月2日24:00,我国确诊的新型冠状病毒患者已超过1.4万人,短短一个来月时间确诊病例数已经远超2003年“非典”疫情的全部确诊数,目前每日新增的确诊数仍在攀升,疫情的传播速度超过了大多数人的预期。科学客观地评估新冠肺炎的传染性强弱以及预测患病人数规模和峰值时间,对决策者实施必要的防控措施、评估对经济的影响以及投资者如何应对都具有重要的现实意义。

1_GnsELOyyfLGvrB1vH6yEDQ.png

作为数学建模的爱好者,而非流行病学的专业人员,作者通过搜集和学习海内外文献,对经典的流行病传播模型(SEIR)有了较准确的理解,通过适当的简化,较直观地向读者介绍模型的原理和各参数的意义。对于经典且成熟的模型来说,输出结果的可靠性完全由输入参数的准确性决定,因此本文从新冠病毒的具体情况入手,着重从多个角度来评估、检验和校正模型的输入值,提高模型输出结果的可靠性。


数理统计学(Mathematical statistics)


数理统计(英语:Mathematical statistics)是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。

51HU-8gdg7L.png

数理统计是将概率论(数学的一个分支)应用于统计,而不是用于收集统计数据的技术。用于此目的的特定数学技术包括数学分析,线性代数,随机分析,微分方程和测度理论。


斯坦福大学2019年人工智能指数报告


斯坦福大学发布了“2019年人工智能指数报告”(Artificial Intelligence Index Report 2019)。

640.png

报告显示,欧洲一直是最大的AI论文出版源,2018年Scopus追踪的人工智能出版物中,欧洲的论文比例上升到27%以上。中国发表的论文占全球人工智能文章的比例从2000年的10%增长到2018年的28%。


Excel 的数据分析工具


Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。Excel最基础的功能是运算和图表的制作,进一步的数据分析功能是函数和数据透视表,还包括VBA和宏等高级数据分析功能。

data_analysis_with_excel-1024x512.png

高级的数据分析,也就是涉及统计学的专业分析方法(如回归分析、方差分析和T检验等)和原理的时候,可以求助于SPSS、SAS这类专业的分析工具,但在实际工作中,Excel仍旧可以胜任。


数据分析师必备的9大技能


刚入行数据分析的朋友吐槽,自己入门到现在只会用excel做做分析图表,但是感觉越做越没有价值,数据分析似乎就是业务数据的分析员,不知道该如何提升自己。

ccfa9deff06264437b3c697c84c41edf.jpg-wh_651x-s_2076677642.jpg

这是因为他没有完全把数据分析的价值挖掘出来,数据分析是为了通过对数据现象的查看来完成对产品、营销策略、运营策略的优化,不仅是对业务,更重要的是要掌握数据分析的各种技能,从能力增长上突破职业的天花板。


2019年最好的六个数据分析工具


数据科学家是21世纪的热门工作。工欲善其事必先利其器。数据分析工具何其多,究竟用哪样才合适?Lewis Chou在Medium上分析了3类6种工具的特点和适用场景,看完这篇文章,相信你就可以知道了。原文标题是:Top 6 Data Analytics Tools in 2019

u0xvd9ffb7n649k2.png

说到数据分析工具,我们总是有疑问。那么多的数据分析工具,它们之间究竟有什么区别?哪个更好?我应该学习哪一个?