做搜索网站挣钱,化妆品网站优势,wordpress主题字体更改,做网站 分辨率应该是多少本文描述的是对国家统计局于2019-01-31发布的《2018年统计用区划代码和城乡划分代码(截止2018年10月31日)》中省市区三级的坐标和行政区域边界的采集。本文更新#xff08;移步查阅#xff09;#xff1a;19-04-15 新采集了2018的省市区三级的坐标和行政区域边界数据csv格式… 本文描述的是对国家统计局于2019-01-31发布的《2018年统计用区划代码和城乡划分代码(截止2018年10月31日)》中省市区三级的坐标和行政区域边界的采集。本文更新移步查阅19-04-15 新采集了2018的省市区三级的坐标和行政区域边界数据csv格式19-03-22 采集了2018的城市数据数据下载 GitHubhttps://github.com/xiangyuecn/AreaCity-JsSpider-StatsGov/releases坐标和边界是高德地图提供的数据接口可通过方法转换成其他坐标系的坐标比如百度地图的。省市区三级是国家统计局统计标准《2018年统计用区划代码和城乡划分代码(截止2018年10月31日)》截稿时是最新的。1. 调用高德地图接口抓取原始数据涉及源码map_geo.js进入高德地图测试页面执行代码即可完成抓取开了4个模拟的线程采集了3300数据首次运行大概2分多钟完成采集。抓取完成后会自动弹出保存文件数据。源码里面包含了对不同地名的处理有些城市不能直接通过编码或城市名称来查询高德地图相对于统计局还是有些滞后。2. 处理数据和导出CSV涉及源码map_geo_格式化.js这个代码比较简单目前只是起到把数据导出来的作用里面写了一大堆方法但运行过一次后发现基本上可以不用了因为对数据进行验证部分发现高德的数据非常完美。代码运行完成就自动弹出保存csv文件数据了。使用高德接口采集是后面才决定的因为本来是用百度地图的接口但数据全部搞完经过使用发现百度地图数据有严重问题参考 肃宁县右下方向那块飞地、路南区唐山科技职业技术学院那里一段诡异的边界 边界百度数据大量线段交叉的无效polygon百度地图测试没有人工无法修正高德没有这个问题高德地图测试并且高德对镂空性质的地块处理比百度强参考天津市对唐山大块飞地的处理高德数据只需要Union操作就能生成polygon百度既有Union操作又有Difference操作极其复杂数据还无效。所以放弃使用百度地图数据。坐标和边界数据和 省市区 数据是分开存储的通过ID来进行关联。数据存储在AreaCity-JsSpider-StatsGov-GEO分库中也可自行到releases中下载。分开的原因是冗余数据总有那么一天会忘记更新这个库人工操作的多尽量减少这种重复数据避免产生问题。采集到的csv文件可以导入到数据库内使用由于POLYGON需要解析蛮复杂的可以参考2019/map_geo_格式化.js内的SQL Server导入用的SQL语句的例子。如果需要特定的POLYGON格式可以根据库里面介绍的字段格式自行进行解析和验证。使用过程中如果遇到多种不同坐标系的问题比如请求的参数是WGS-84坐标(GPS)我们后端存储的是高德的坐标可以通过将WGS-84坐标转成高德坐标后进行处理百度的坐标一样。转换有相应方法转换精度一般可以达到预期范围可自行查找。或者直接把高德的原始坐标数据转换成目标坐标系后再存储精度。SQL Server中的运行结果大概2分钟完成POLYGON的转换表数据物理存储空间大概300M数据下载和相关问题请到 Github查看https://github.com/xiangyuecn/AreaCity-JsSpider-StatsGovreleases内除了有省市区三级坐标和行政区域边界csv数据外还有处理好的3级或者4级省市区镇 csv数据提供下载。如果这个库有帮助到您请 Star 一下。