Advertisement

2020年最新Python3.8爬取国家统计局地区代码(包括省份市区街道乡镇)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本教程详细介绍了使用Python 3.8版本从国家统计局网站上抓取最新的地区代码数据的方法。涵盖省级、市级、区县级及街道级等各级行政区划的全面解析与提取技巧,适合数据分析和地理信息系统开发人员参考学习。 ```python import urllib.request import time from bs4 import BeautifulSoup indexs = index.html url = http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/ txt = urllib.request.urlopen(url + indexs).read().decode(gbk) soup = BeautifulSoup(txt, html.parser) lista = soup.find_all(a) lista.pop() for a in lista: # 进行后续操作 ```

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 2020Python3.8
    优质
    本教程详细介绍了使用Python 3.8版本从国家统计局网站上抓取最新的地区代码数据的方法。涵盖省级、市级、区县级及街道级等各级行政区划的全面解析与提取技巧,适合数据分析和地理信息系统开发人员参考学习。 ```python import urllib.request import time from bs4 import BeautifulSoup indexs = index.html url = http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/ txt = urllib.request.urlopen(url + indexs).read().decode(gbk) soup = BeautifulSoup(txt, html.parser) lista = soup.find_all(a) lista.pop() for a in lista: # 进行后续操作 ```
  • 2019数据.txt
    优质
    该文档包含2019年由国家统计局发布的详细数据,涵盖了中国各省份、城市、区县以及街道的统计信息。这些数据可通过编程手段进行爬取和分析。文档旨在为研究人员和社会科学爱好者提供全面的数据支持,以便深入探究中国的地区经济发展状况及社会变迁趋势。 2019年国家统计局省市区、街道数据爬取的Python源码仅能爬取到街道层级的数据,居委会由于页面上没有a标签而未能进行爬取。如有需要,请自行调整代码。
  • 20186月数据
    优质
    本资料汇集了2018年6月中国各省市乡镇街道的统计数据,涵盖人口、经济、社会等多个维度的信息,是了解地方发展状况的重要参考。 2018年6月,统计局公布了全国各省、市、乡镇街道的最全数据,包含编码。
  • 发布202011月6日全五级行政划(/县、/、村/社数据
    优质
    该统计数据为2020年11月6日全国各级行政区域划分情况,包括省级、市级、县级及以下的详细分布,由国家统计局发布。 省/自治区/直辖市:31 条 市:342 条 区/县:3275 条 镇/街道:41895 条 村/社区:634262条 总计:634262 条
  • 2024行政划:(四级数据)
    优质
    本资料提供2024年中国最新的行政区划信息,涵盖省级、市级、区级以及乡镇和街道四个层级的数据,便于查询与研究。 2024年最新行政区划数据包括省、市、区、乡镇街道四级结构。
  • 2021带经纬度的址数据
    优质
    本数据库提供2021年度更新的详尽中国地理信息,包含全国各省市县级行政区划及其下属街道、乡镇和乡村的具体位置坐标(经纬度),适用于各类地理位置分析与应用。 21年最新带经纬度的省、市、区县、街道镇及乡村区划地址数据。
  • 四级SQL查询(版)
    优质
    本资源提供最新的省市区县乡镇街道层级SQL查询代码和数据库表结构设计,适用于各类地理信息管理系统开发。 创建一个名为`sys_district`的表来存储省市区县乡镇街道的信息(包含经纬度): ```sql CREATE TABLE `sys_district` ( `id` varchar(64) NOT NULL COMMENT ID, `parent_id` varchar(64) DEFAULT NULL COMMENT 父级ID, `code` varchar(255) DEFAULT NULL COMMENT 区划编码, `name` varchar(255) DEFAULT NULL COMMENT 区划名称, `level` varchar(10) DEFAULT NULL COMMENT 级别:0表示省/自治区/直辖市,1表示市级,2表示县级, `center` varchar(100) DEFAULT NULL COMMENT 经纬度信息, PRIMARY KEY (`id`) USING BTREE ); ```
  • 2020居委五级数据库(依据2月25日更
    优质
    本数据库收录了截至2020年的全国省、市、区县、街道及居委会五级最新区划代码,基于国家统计局于2023年2月25日的官方更新数据。 从国家统计局获取了省市区街道居委会五级区划代码的数据,总计704,749条记录,这些数据更新于2020年2月25日。
  • /址SQL查询
    优质
    本资源提供全面的中国行政区域数据库查询服务,涵盖省、市、区乃至乡镇/街道各级行政区划信息,支持灵活高效的SQL语句查询操作。 省、市、区、乡镇/街道地址行政编吗、全称、简称、经纬度、级别、排序,四级联动。 建表SQL: ```sql DROP TABLE IF EXISTS `area`; CREATE TABLE `area` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `parent_id` int(11) NOT NULL COMMENT 父级, `name` varchar(50) NOT NULL DEFAULT COMMENT 名称, `short_name` varchar(30) NOT NULL DEFAULT COMMENT 简称, `longitude` varchar(30) NOT NULL DEFAULT COMMENT 经度, `latitude` varchar(30) NOT NULL DEFAULT COMMENT 纬度, `level` smallint(6) NOT NULL DEFAULT 0 COMMENT 级别:1 省,2 市,3 区,4 乡镇/街道, `sort` mediumint(9) NOT NULL COMMENT 排序, `status` tinyint(1) NOT NULL DEFAULT 1 COMMENT 状态:0无效,1有效, PRIMARY KEY (`id`), KEY `idx_parent_id` (`parent_id`), KEY `idx_longitude_latitude` (`longitude`,`latitude`), KEY `idx_level_status` (`level`,`status`) ) ENGINE=MyISAM AUTO_INCREMENT=659004503 DEFAULT CHARSET=utf8mb4 COMMENT=地址区域表; ```
  • 2020数据
    优质
    本资料集收录了截至2020年的最新全国省、市、街道及社区详细划分信息,为研究和数据分析提供精准地理参考。 这是从国家统计局获取的2020年最新省市区街道社区数据,包含五级联动的数据,并以SQL格式提供,可以直接导入数据库使用。数据主要记录了地区代码、地区名称、上级地区代码、完整地址以及地区的级别信息。