截止年7月11日,根据世卫组织提供的数据,全球新冠病*累计确诊人数已超过55亿人,死亡人数超过万人,死亡率2.17%。得益于中国*府和人民的努力,中国本土疫情得到了很好的控制,但随着印度德尔塔变异*株的传播,抗疫形势再度变得严峻。
目前全球疫情最严重的国家是美国、印度和巴西。欧洲疫情最严重的国家是法国、德国和英国。因感染新冠病*死亡人数超过20万的国家有:美国.1万人,巴西67.3万人,印度52.5万人,俄罗斯38.1万人,墨西哥32.6万人、秘鲁21.4万人。上述6国因感染新冠而死亡的人数约占全球的一半。
我们再从数据方面分析一下来看看全球疫情情况。获取的数据如下:所在大洲、城市、当前确诊、累计确诊、确诊排名、疑似病例、治愈人数、死亡人数、死亡人数排名、死亡率、死亡率排名。
网站分析
我们今天要爬取的网站是丁香园,这个网站每日实时更新最新疫情数据。如下:
现在目标很明确,把上面这一堆数据取下来,下面有请Python出场
代码分解
打开Notebook,导入以下包
接着设置下URL和headers
解析每个字段信息
写一个循环重复执行刚刚的操作
数据汇总加保存
执行代码
成功保存数据如下
数据可视化
最后我们使用pro绘图来绘制可视化图表,例如饼图、折线图、柱状图等
获取python源码
爱学习的小伙伴,本次案例的完整python源码已上传社区动态第一条,搜索SPSSPRO,进入社区,即可领取