当前位置: 首页 > 编程笔记 >

利用Python抓取行政区划码的方法

易镜
2023-03-14
本文向大家介绍利用Python抓取行政区划码的方法,包括了利用Python抓取行政区划码的方法的使用技巧和注意事项,需要的朋友参考一下

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

 类似资料:
  •        在此可以对全球行政区划数据进行下载,点击后即可按照国家为单位进行选择下载。数据集包含全球(不含中国及中国邻国)233个国家4级行政区划数据:一级(国家)边界、二级(省级)边界、三级(市级)边界、四级(县级)边界。

  • 进入区划图层,点击“载入行政区划”按钮,可以打开区划选择框 打开区划框后,支持将省、市、区县、乡镇/街道按照行政边界转化为业务区划,在弹窗内单击向下钻取省市区,双击确认选择,对行政区进行选中批量导入 导入后,是按照行政区面进行展示 操作步骤如下: 注意: 选择行政区的时候,一旦选择了上一级的区划范围,就不能再选择在他下面一级的区划,例如下图:已经选择导入“北京市全部区县”,这时候就不能再选择某一个

  • 操作步骤: 第一种方式: ①进入编辑地图页面,点击右上角"加载行政区划"按钮。 ②点击按钮后,弹出加载行政区划窗口。 1)亿景智图提供了省、市、县三级行政区划示意图供用户直接加载使用,可以加载全部的行政区划,也可以加载指定的行政区划。 2)搜索选择:如果只是添加一个行政区划,在右上角搜索框中输入关键字,如“海淀区”,回车,点击搜索结果,在已选行政区划显示后,点击完成区划加载完成。 注意 ●搜索区域

  • 供地图d3获取echarts地图绘制的数据使用的FeatureCollection文件 一般找的都是比较久之前的,最新的标准或者国标在哪能找到呢?

  • 问题内容: 我想从网站上获取每天的日出/日落时间。是否可以使用Python抓取网络内容?使用什么模块?有没有可用的教程? 问题答案: 结合使用urllib2和出色的BeautifulSoup库:

  • 本文向大家介绍python抓取百度首页的方法,包括了python抓取百度首页的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python抓取百度首页的方法。分享给大家供大家参考。具体实现方法如下: 希望本文所述对大家的Python程序设计有所帮助。