
一个简单的Python脚本,用于筛选并提取来自GDELT项目事件数据库的数据。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
利用一个简化的Python脚本,便可从(该数据集是研究全球人类社会最广泛的开放数据集)中提取数据。 该脚本以152种语言,涵盖了跨越200年的总共8.1万亿个数据点。 事件数据库包含了超过25亿条记录,这些记录以由制表符分隔的文件形式进行组织。 截至2013年3月31日,事件记录将以月度和年度文件形式存储,对应于事件发生的具体月份和年份。 从2013年4月1日起,每日都会生成新的文件,并按照事件在世界新闻媒体中被报道的日期(而非事件实际发生的日期)来存储相关记录。 我们主要关注的是该数据库的1.0版本,该版本每天都会持续更新并添加新的条目。 该脚本旨在从GDELT项目事件数据库v1.0原始数据集中提取事件信息,并利用CAMEO分类法对所需类型的事件进行筛选。 此外,它还采用FIPS 10-4国家/地区代码对需要采取行动的国家/地区进行精确过滤,最终输出为一个包含给定事件和国家集标识事件的逗号分隔值文件。 此脚本的依赖关系...
全部评论 (0)
还没有任何评论哟~


