170 likes | 333 Views
植物标本空间数据规范化整理. 李 奕 中国科学院植物研究所 2009 年 8 月 27 日. 标准化目标. 完成本所及外所标本数据库中采集地的省,县级地名与中华人民共和国行政区划代码国家标准( GB/T 2260-2007 )的匹配,从而实现采集地数据县级标准化,为 WebGIS 系统提供基础数据。. 数据的基本情况. 本所数据共 1668982 条. 国内标本 1444450 条. 国外标本 224532 条. 有县级分布 1140304 条. 无县级分布 304146 条. 数据的基本情况. 外所数据共 2582972 条. 国内标本 2501298 条.
E N D
植物标本空间数据规范化整理 李 奕 中国科学院植物研究所 2009年8月27日
标准化目标 完成本所及外所标本数据库中采集地的省,县级地名与中华人民共和国行政区划代码国家标准(GB/T 2260-2007)的匹配,从而实现采集地数据县级标准化,为WebGIS系统提供基础数据。
数据的基本情况 本所数据共1668982条 国内标本1444450条 国外标本224532条 有县级分布1140304条 无县级分布304146条
数据的基本情况 外所数据共2582972条 国内标本2501298条 国外标本81674条 有县级分布1866628条 无县级分布634670条
数据的基本情况 出现的县级地名数量
主要问题 • 省份错误 修改省份 • 区划发生变化 根据历史沿革匹配至现在的区划名称 • 无法查到 根据小地名反推 根据采集人和号推定 • 县名重复 江西省 49.德化县→九江县(福建、四川也有德化县) 50.泸溪县→资溪县(湖南也有泸溪县) 51.龙泉县→遂川县(浙江、贵州也有龙泉县) 52.新昌县→宜丰县(浙江也有新昌县) 53.新城县→黎川县(直隶、吉林、山东、浙江、贵州也有新城县) 54.兴安县→横峰县(广西也有兴安县) 55.长宁县→寻邬县(广东、四川也有长宁县) 56.安仁县→馀江县(湖南也有安仁县) 57.义宁县→修水县(广西也有义宁县) 58.永宁县→宁冈县(山西、河南、广西、贵州也有永宁县)
主要问题 无法匹配 • 广东,清远市: 1958年,连县、连南、连山、阳山四县合并,称连阳各族自治县 (连州市,连南瑶族自治县,连山壮族瑶族自治县,阳山县) • 甘肃,陇南市: 1958年9月5日,撤销徽县、成县,合并成立徽成县。 • 青海,茫崖镇:海西蒙古族藏族自治州-茫崖行委 国标中无代码 • 江苏:沛丰县:为沛县和丰县
主要问题 特殊匹配 • 宁夏,陶乐县:2003年12月31日撤销石嘴山市陶乐县。将原陶乐县的红崖子乡、高仁乡、马太沟镇划归平罗县管辖,月牙湖乡划归银川市兴庆区管辖。 平罗县 • 吴县:1995年6月8日,国务院批准,撤销吴县,设立吴县市,以原吴县行政区域为吴县市区域,市人民政府驻长桥镇。2000年12月31日,经国务院批准,撤销县级吴县市,设立苏州市吴中区、相城区。吴中区辖原县级吴县市的长桥、胥口、木渎、横泾、浦庄、渡村、东山、西山、藏书、光福、镇湖、东渚、甪直、车坊、郭巷15个镇。区人民政府驻长桥镇。新设立的苏州市相城区辖原吴县市的陆慕、蠡口、黄桥、渭塘、太平、湘城、阳澄湖、北桥、黄埭、东桥、望亭、通安12个镇。区人民政府驻陆慕镇。 苏州市
主要问题 特殊匹配 • 河北省宛平县:1952年7月辖区划归北京市,县建制撤销。今北京西城区、宣武区、丰台区、石景山区、海淀区、门头沟区之全部或大部都曾为原宛平县辖。 北京市 • 西藏,盐井县:1983年10月8日,国务院批准设立4县:设立盐井县,以芒康县部分地区为其行政区域。实际上没有成立。 芒康县 • 四川,义敦县:1978年撤销乾宁、邓柯、义敦3县,将乾宁县并入道孚、雅江2县;邓柯县并入石渠、德格2县;义敦县并入巴塘、理塘2县。 甘孜藏族自治州
下阶段的工作内容 • 完成本所及外所剩余数据的标准化工作 预计于9月中旬完成; • 未处理的无县数据的处理 问题:反推成功率非常低 • 根据小地名进行县下等级的标准化 问题:小地名很多非地名
下阶段的工作内容 • 完成本所及外所剩余数据的标准化工作 预计于9月中旬完成; • 未处理的无县数据的处理 问题:反推成功率低 工作量巨大 • 根据小地名进行县下等级的标准化 问题:小地名很多非地名
下阶段的工作内容 • 完成本所及外所剩余数据的标准化工作 预计于9月中旬完成; • 未处理的无县数据的处理 问题:反推成功率非常低 • 根据小地名进行县下等级的标准化 问题:部分地名为空(10-15%) 少部分非地名