[发明专利]一种基于随机森林的人口数量预测方法在审
申请号: | 202110826722.2 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113743453A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 高蓝宇;张宸;代子风;韩松杰;张长胜;张斌 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 人口数量 预测 方法 | ||
本发明提供了一种基于随机森林的人口数量预测方法,属于机器学习技术领域。本发明包括人口数据预处理和随机森林模型构建两个模块。所述人口数量预测方法包括:步骤一,填补人口数据中空缺部分;步骤二,提取出影响人口因素的主要特征;步骤三,构建人口预测模型的基学习器;步骤四,组合基学习器,生成随机森林模型,并得出预测结果。本发明对海量人口数据进行特征提取处理,利用随机森林模型预测人口数量,预测效果比单个回归树和线性回归预测精度更高。
技术领域
本发明属于机器学习技术领域,涉及一种基于随机森林的人口数量预测方法。
背景技术
人口数量是地区的发展基础,是社会组成中的重要资源,人口数量多的区域往往是发达地区。根据统计,东北三省的人口数量在逐渐减少,辽宁省尤为突出。因为辽宁省的GDP已经连续3年呈现负增长的态势;人口数量一旦减少将会导致非常严重的经济问题。一个地区的人口数量的变化将对该地区产生巨大的影响,若一个地区的人数慢慢减少,随之该地区的经济、科技、教育、工业都会受其影响,所有的指标都会随之降低,最后对该地区产生所有生活,交通,就业等产生负面的影响。可见准确的预测人口数量对一个地区的发展至关重要。
现有的人口预测方法对人口数据考虑有所欠缺:(1)人口的自然增长率并不是一个定值,随着地区经济的发展进步,医疗和住房等因素的改变,人口自然增长率会随之变化;(2)大多数方法都没有考虑到人口的流动问题;(3)在计算人口的参数时,受环境因素的影响,可能会导致计算结果存在误差,最终得到的人口数量预测结果也就不够准确;(4)同一因素对不同地区的影响程度又有所差异,现有的大多数预测模型不能考虑多类型数据,通用性较差。
决策树可以处理数据型和常规型属性,能考虑更多的影响因素,计算消耗代价比一般的模型小,是进行预测的有效方法。但这种方法在数据指标不平衡的情况下误差比较明显,测试数据上的错误率比较高。随机森林是一种组合分类器技术,由多颗决策树组合而成,相较于决策树等单分类器,具有更好的预测性能。针对人口数据部分指标不平衡的情况,随机森林可以平衡误差,对高维度数据处理效果更好。
发明内容
对于人口数量预测问题,由于传统的预测方法考虑的因素都比较少,人口流动性问题和以往表现的大有不同。本发明提出了一种基于随机森林的人口数量预测方法,该方法有效解决了人口数据处理问题,并通过实验结果证明准确性高。
针对海量指标数据,本发明首先对缺失类型的数据,分别使用了线性回归与拉格朗日插值技术对他们补充;其次,先使用相关系数对指标之间的线性关系进行分析并根据线性关系的程度剔除掉冗余特征,然后使用主成分分析技术,继续在数据中提取所含信息更多的特征。然后使用随机森林的方法对指标数据进行建模预测,人口指标数据中利用自助采样法采取n个样本,再从每一个样本中随机抽取n个特征,分别建立人口预测的单个学习器回归树,发明预测类型为回归,所以该单个学习器为采用均方误差准则的回归树。通过自助采样的方法,可以得到多个基于人口数据的回归预测模型,在将他们统一组合到一起,构成一个回归预测模型,这就是基于人口指标数据所形成的随机森林模型。最后将测试指标输入到随机森林中,会得到多个预测结果,对这些结果做平均值处理,得出最后的人口的预测数值。综上,该过程可以分成人口数据预处理和随机森林模型构建两部分。
本发明的技术方案为:
一种基于随机森林的人口数量预测方法,该方法包括人口数据预处理模块和随机森林模型构建模块。所述人口数据预处理模块,全面地考虑了人口数量影响因素;能有效解决处理人口数据的部分缺失;针对不同地区特点找出该地区的主要影响因素:能够处理绝大多数地区的人口数据。所述随机森口模型构建模块,能根据最优特征生成回归树及随机森林,能更好平衡误差。
所述人口数据预处理模块,实现以下功能:
(1)补充各项指标的缺失数据;
(2)剔除人口数据中的冗余特征;
(3)提取影响人口数量的关键特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110826722.2/2.html,转载请声明来源钻瓜专利网。