[发明专利]一种基于随机森林模型的人口数据空间化方法在审
申请号: | 201611004450.3 | 申请日: | 2016-11-15 |
公开(公告)号: | CN106650618A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 柳林;谭敏;刘凯 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 模型 人口 数据 空间 方法 | ||
1.一种基于随机森林模型的人口数据空间化方法,其特征在于,所述方法的基本步骤为:
(1)获取行政区的常住人口数、灯光数据以及其它对人口分布具有影响的自然和社会经济因素的原始数据,对数据进行预处理,得到变量因子距离数据、灯光数据、行政区人口密度的对数和二值化栅格转换后的变量因子数据;
(2)统计各个行政区内的每个变量因子的平均值或最常出现的值并匹配到行政区边界;
(3)将步骤(1)预处理后得到的变量因子距离数据、灯光数据和行政区人口密度的对数、二值化变量因子栅格数据、步骤(2)得到的变量因子的平均值或最常出现值作为随机森林模型的输入,来寻找变量因子与人口密度的对数之间的关系并输出变量因子重要性,基于这个关系反演出L×L米网格的人口数,得到人口数据空间化的初步结果;
(4)利用分区密度制图修正人口数据空间化的初步结果,最终实现基于随机森林模型的L米网格的人口数据空间化。
2.根据权利要求1中所述的基于随机森林模型的人口数据空间化方法,其特征在于,所述的步骤(1)中的预处理包括:
步骤S11,将所有空间数据转换成统一投影坐标系以及参考椭球体;
步骤S12,将行政区的常住人口数除以行政区面积得到行政区的人口密度,并对人口密度取对数;
步骤S13,对灯光数据进行双线性的重采样成L×L米的栅格;
步骤S14,对其它对人口分布具有影响的自然和社会经济变量因子进行欧氏距离计算。
步骤S15,对其它矢量格式的对人口分布具有影响的自然和社会经济变量因子进行二值化栅格转换。
3.根据权利要求1中所述的基于随机森林模型的人口数据空间化方法,其特征在于,所述的步骤(1)中步骤S15的二值化栅格转换是将矢量格式的变量因子转换成栅格格式,并和行政区范围进行合并,0表示变量因子为空,1表示变量因子不为空。
4.根据权利要求1中所述的基于随机森林模型的人口数据空间化方法,其特征在于,所述的步骤(2)中的统计各个行政区内的每个变量因子的平均值或最常出现的值具体是指对于变量因子的距离数据及其他连续变量因子进行平均值的统计,对于二值化的变量因子栅格数据进行最常出现值的统计。
5.根据权利要求1中所述的基于随机森林模型的人口数据空间化方法,其特征在于,所述的步骤(4)中的分区密度制图法是按照随机森林得到的每个网格的人口占一个行政区的所有网格的总人口的比例重新分配每个网格的人口数,计算公式如下:
Pi=Sj×Di/Dj
式中,Pi为每个网格内的人口数,Sj为该网格所在的行政区的人口总数,Di为该网格根据随机森林模型估计得到的人口数,Dj为该网格所在的行政区的所有网格的根据随机森林模型估计得到的人口总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611004450.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于概率潜在语义分析的行人异常识别方法
- 下一篇:一种人体动作识别方法