《疫情学习笔记之数据可视化》记录了作者在疫情期间通过数据分析与可视化技术探索和理解新冠疫情的过程,结合实际案例分享知识与经验。
学习记录之新冠疫情可视化旨在通过爬取丁香园网站上的疫情数据进行分析与展示,以便更好地理解和跟踪疫情的发展。主要涉及的数据爬取、解析、存储及可视化的技术。
在Python中,`requests`模块用于发送HTTP请求,模拟浏览器向目标网站发送请求以获取所需数据,并利用正则表达式(re模块)从HTML页面中提取特定信息。接着将这些数据保存到本地文件以便后续处理和分析。
此次学习过程中我们获得了两个主要的数据集:全国疫情总览与每日新增病例详情。通过这两个数据集,我们可以创建各类图表来直观展示疫情情况:
1. 全国疫情地图的制作使用了`folium`或`geopandas`等地理信息库,将感染数量与地理位置对应起来。
2. 湖北地区内部具体分布图则可能以条形图或者热力图形式呈现,突出显示受影响最严重的区域。
3. 疫情增长趋势分析会用到折线图或柱状图来展示每日新增病例和累计确诊病例随时间的变化情况。
在数据可视化阶段,我们使用了`matplotlib`, `seaborn` 或者 `plotly`等库制作图表。这些工具提供了丰富的图形选项与交互性功能,使疫情信息的展现更加生动直观。
总之,在学习新冠疫情可视化的过程中,掌握了网络爬虫(requests、re模块)、数据解析(json模块)以及利用Python可视化库(matplotlib, seaborn等)进行数据分析和展示的技术。通过上述技术的应用可以有效获取并呈现疫情相关的信息,从而帮助我们更深入地理解疫情的发展趋势与态势。