[发明专利]一种精细尺度人口数据空间化方法在审
| 申请号: | 201910678328.1 | 申请日: | 2019-07-25 |
| 公开(公告)号: | CN110716998A | 公开(公告)日: | 2020-01-21 |
| 发明(设计)人: | 王艳慧;赵文吉;张建辰;齐文平 | 申请(专利权)人: | 首都师范大学 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06N3/04;G06N3/08;G06Q50/26 |
| 代理公司: | 11296 北京东方汇众知识产权代理事务所(普通合伙) | 代理人: | 王庆彬 |
| 地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 人口数据 空间化 土地利用类型 处理区 土地利用现状图 土地利用数据 空间数据库 地理信息 多元回归 精度验证 边界图 调取 行码 匹配 尺度 精细 检验 分析 | ||
1.一种精细尺度人口数据空间化方法,其特征在于,包括如下步骤:
一)
11)、从系统储存的待处理区土地利用现状图层中调取土地利用数据,按照第二次全国土地调查土地分类标准,把土地利用数据所指代土地分为8类:01耕地、02园地、03林地、04草地、20城镇村及工矿用地、10交通运输用地、11水域及水利设施用地、12其他用地,之后进入步骤12);
12)、提取出待处理区的行政村边界图层,图层包含的基本属性字段包括行政村名称、行政村区划代码,将行政村边界图层作为空间数据,将行政区划代码作为匹配标识关键字段,将行政村社会统计数据作为属性数据导入到行政村图层属性中,基于“行政区划代码”公共字段完成空间数据与属性数据的匹配,行政村社会统计数据集合包括行政区划代码字段;之后进入步骤13);
13)、进行编行码匹配,建立地理信息空间数据库,地理信息空间数据库包含空间数据和属性数据,空间数据包括土地利用现状数据、行政村边界数据,属性数据包括行政村的社会统计数据;对土地利用现状图层与行政村边界图层进行叠加分析,提取并统计出各村各种土地类型的面积,用每种土地利用类型的面积除以行政村的面积,再乘以100%,即得到该土地利用类型指数;
采用双侧检验的皮尔逊(pearson)相关系数,分析各个村的土地利用类型指数与人口密度的相关关系,计算公式如下:
其中:rxy为皮尔逊(pearson)相关系数;
Xi代表土地利用指数的值,i指的是第几种土地类型,土地类型的顺序可自设,代表了土地利用指数值的平均值;
Yi代表的是人口密度的值,i指的是第几个行政村的人口密度值,各行政村的标号顺序可自设,代表人口密度值的平均值;
rxy即土地利用指数样本的值Xi与人口密度样本的值Yi这两个要素的皮尔逊(pearson)相关系数,rxy的值在[-1,1]之间:rxy>0表示两个要素存在正相关型;rxy<0表示两个要素之间存在负相关性;rxy的绝对值越接近1,则表示两要素之间的关系越密切,越密切代表两者直接的相关性越大;反之,若rxy绝对值越接近0,则表示两者之间关系越不密切;
在0.01显著性水平下,通过检验的土地利用指数为耕地指数、林地指数、城镇村及工矿用地指数和交通用地指数,说明01耕地、03林地、20城镇村及工矿用地、10交通用地是影响人口分布的主要因素;
二)
分别选取IDW方法、多元回归方法和BP神经网络方法对人口数据进行空间化,并选择精度最高的方法进行最终人口数据空间化;
在进行人口数据空间化操作之前,首先将待计算处理的地域划分为500m×500m的格网,然后以格网作为基本空间单元进行人口数据空间化;
人口数据空间化的方法有三种,分别为IDW方法、多元回归方法和BP神经网络方法:
21)在IDW插值方法中,把未通过0.01显著性水平检验的土地利用类型的人口密度设为0,设置栅格图像的空间分辨率与格网单元大小保持一致;
22)在多元回归方法中,把土地利用类型通过划分到每个格网中,选取人口密度值为因变量,耕地指数、林地指数、城镇村及工矿用地指数、交通用地指数为自变量,根据多元线性回归方程计算出每个格网的人口数目,然后以行政村为单位汇总得到缺失的村人口数;
所述多元线性回归方程公式如下:
y1=β0+β1X11+β2X21+β3X31+β4X41+ε
其中,y1为因变量,即人口密度值;β0为回归常数,X11、X21、X31、X41为自变量,X11为耕地指数、X21为林地指数、X31为城镇村及工矿用地指数、X41为交通用地指数,β1、β2、β3、β4为4个自变量的回归系数;ε为随机误差;
23)在BP神经网络方法中,采用的BP神经网络具有3层:一个输入层,一个中间隐含层,一个输出层;输入层包含4个输入节点,分别输入耕地指数、林地指数、城镇村及工矿用地指数、交通用地指数;中间隐含层的激励函数采用Sigmoid函数;输出层的输出结点为人口密度;
三)精度验证
随机抽取30个村作为检验样本,跟这30个村的人口实测数据,采用3种不同方法的实验模拟结果进行比较分析,误差的计算方法如下:
其中EP为人口误差百分比,popo为步骤二)三种模型方法中每一种方法模拟出的人口数据值,popt为村实际调查统计人口数目;
最后选取误差值最小的那种方法得到的数据结果作为最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910678328.1/1.html,转载请声明来源钻瓜专利网。





