Coronavirus (COVID-19) Visualization & Prediction 笔记
Coronavirus (COVID-19) Visualization & Prediction 笔记 项目链接:https://www.kaggle.com/therealcyberlord/coronavirus-covid-19-visualization-prediction 总结 写在前面:这个项目本来以为很复杂,会有很复杂的数据处理过程,其实就还好。由于图和表太多,把总结写在前面。 首先,没用到什么比较高级的算法什么的,对于python脚本能力要求不是很高。 其次,对我比较有价值的数据分析部分是该项目对新冠病毒未来数据的预测部分,包括SVM, Polynomial Regression, Bayesian Ridge Regression等回归方法。以及其中sklearn相关函数的使用,如 train_test_split, PolynomialFeatures等。 最后,关于数据的可视化这一部分,基本上和新闻上说的差不多,美国一枝独秀。 图和表巨多,有兴趣可以下去点点。部分结果有注释。 正文 冠状病毒(Coronavirus)是一个病毒家族,是由这些病毒具有的冠状突刺(spiky crown)而命名。新型冠状病毒,也就是SARS-CoV-2,是一种传染性呼吸道病毒,首次在中国武汉报道。2020年11月2日,世界卫生组织将这种新型冠状病毒引起的疾病命名为COVID-19。这篇Notebook旨在通过数据分析和预测来探索COVID-19。 新型冠状病毒病例数据由Johns Hopkins University提供 新型冠状病毒移动数据由Apple提供 从World Health Organization获取更多信息 从Centers for Disease Control and Prevention获取更多信息 从JHU CCSE Dashboard查看地图可视化数据 源代码:my Github 最后更新:美国东部时间2020年10月20日下午5:13 数据表更新 最新更新:10月20日每日报告数据更新时间序列数据更新为10/19,移动性数据更新为10/19预测模型2020年3月13日开始训练。因此,较早的日期可能不准确。 目录 Exploring Global Coronavirus Cases Exploring Read more…