[发明专利]基于随机森林算法预测景区客流量的方法和装置在审

专利信息
申请号: 201911406473.0 申请日: 2019-12-31
公开(公告)号: CN111178633A 公开(公告)日: 2020-05-19
发明(设计)人: 皮慧婷;洪学海;杨勇;陈鑫 申请(专利权)人: 上饶市中科院云计算中心大数据研究院
主分类号: G06Q10/04 分类号: G06Q10/04;G06K9/62;G06Q50/14
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 张勋
地址: 334000 江西*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 随机 森林 算法 预测 景区 客流量 方法 装置
【权利要求书】:

1.一种基于随机森林算法预测景区客流量的方法,其特征在于,包括:

建立参数优化的随机森林算法模型,根据拟合优度和平均标准误差调试模型参数,基于网格搜索算法寻找最优随机森林算法模型;

将特征数据集输入到所述最优随机森林算法模型,得到预测景区未来的日客流量。

2.根据权利要求1所述的方法,其特征在于,所述特征数据集的获取方式包括:

收集景区历史的客流量和特征因子得到历史原始数据,所述特征因子包括天气、节假日、最高气温、最低气温、季节;

针对不同类型缺失值分别使用拉格朗日插值法和同期历史数据均值补全所述历史原始数据缺失的游客数据值;

通过高维映射对离散型定性特征进行量化;

进行标准化和归一化处理。

3.根据权利要求1所述的方法,其特征在于,所述建立参数优化的随机森林算法模型包括:

定义训练集和测试集,按比例分割整个数据集的训练集和测试集,建立训练集/测试集的输入和输出矩阵;

计算R方值、均方差和平均绝对误差;

根据拟合优度和平均标准误差调试模型参数,基于网格搜索算法寻找最优随机森林模型。

4.根据权利要求1所述的方法,其特征在于,所述基于网格搜索算法寻找最优随机森林模型具体包括:

确定决策树的数量k和候选分裂属性数mtry的范围,设定步长在k和mtry坐标系上建立二维网格,网格节点就是相应的k和mtry的参数对;

对网格节点上的每一组参数构建随机森林,并利用袋外数据估计分类误差;

选择分类误差最小的参数k,mtry,若分类误差或者步长满足要求,则输出最优参数和分类误差。

5.根据权利要求1所述的方法,其特征在于,所述计算R方值、均方差和平均绝对误差包括:

R方值

均方差

平均绝对误差

其中,y代表每日客流量,yi代表历史第i天的客流量。

6.一种装置,其特征在于,包括:

特征数据集单元,根据景区历史的客流量和特征因子构成的历史原始数据经过处理得到的特征数据集;

随机森林算法模型,用于根据输入的所述特征数据集输出预测到的景区未来的日客流量。

7.根据权利要求6所述的装置,其特征在于,所述特征数据集单元包括:

采集单元,用于收集景区历史的客流量和特征因子得到历史原始数据,所述特征因子包括天气、节假日、最高气温、最低气温、季节;

第一处理单元,用于针对不同类型缺失值分别使用拉格朗日插值法和同期历史数据均值补全所述历史原始数据缺失的游客数据值;

第二处理单元,用于通过高维映射对离散型定性特征进行量化;

第三处理单元,用于进行标准化和归一化处理。

8.根据权利要求6所述的装置,其特征在于,所述随机森林算法模型通过如下方式生成:

定义训练集和测试集,按比例分割整个数据集的训练集和测试集,建立训练集/测试集的输入和输出矩阵;

计算R方值、均方差和平均绝对误差;

根据拟合优度和平均标准误差调试模型参数,基于网格搜索算法寻找最优随机森林模型。

9.根据权利要求8所述的装置,其特征在于,所述随机森林算法模型基于网格搜索算法寻找最优随机森林模型具体包括:

确定决策树的数量k和候选分裂属性数mtry的范围,设定步长在k和mtry坐标系上建立二维网格,网格节点就是相应的k和mtry的参数对;

对网格节点上的每一组参数构建随机森林,并利用袋外数据估计分类误差;

选择分类误差最小的参数k,mtry,若分类误差或者步长满足要求,则输出最优参数和分类误差。

10.根据权利要求9所述的装置,其特征在于,所述随机森林算法模型计算R方值、均方差和平均绝对误差包括:

R方值

均方差

平均绝对误差

其中,y代表每日客流量,yi代表历史第i天的客流量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上饶市中科院云计算中心大数据研究院,未经上饶市中科院云计算中心大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911406473.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top