[发明专利]一种基于Xgboost算法的交通量预测方法有效
申请号: | 201910756049.2 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110555989B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 温惠英;张东冉 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G08G1/065;G06K9/62;G06Q10/04;G06Q50/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;黄海波 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 xgboost 算法 交通量 预测 方法 | ||
1.一种基于Xgboost算法的交通量预测方法,其特征在于,包括如下步骤:
步骤S1:采集交通量数据,进行数据归一化,划分为训练数据和测试数据;
步骤S2:基于Xgboost算法,对训练数据进行模型训练,确定模型参数;
步骤S3:输入Xgboost模型参数、测试数据,进行交通流的预测;
步骤S4:对Xgboost模型预测结果进行误差评估,还原预测数据进行输出;
其中,所述步骤S2中,Xgboost算法将一系列弱学习器的预测结果组合成为强学习器,对损失函数进行二阶泰勒展开,将预测项和正则化项结合起来,在优化过程中加入二阶导数信息,简化目标函数实现计算资源优化,采用弱分类器集成算法选取合适的参数,具体流程包括:
步骤S21、采用岭回归算法运行训练数据,选取最优alpha值;
步骤S22、采用随机森林算法运行训练数据,选取最优参数;
步骤S23、采用融合算法采取两种模型的优点,提取最优参数,完成模型训练。
2.根据权利要求1所示的基于Xgboost算法的交通量预测方法,其特征在于,所述步骤S1具体包括:
采用线圈对行驶车辆信息收集统计,并分为若干不同时间间隔的交通量数据;
对数据进行归一化,并按照比例划分为训练数据和测试数据,其中,所述数据归一化采用min-max标准化,公式如下:
其中,x*是归一化后的交通量数据,其中max为样本数据的最大值,min为样本数据的最小值。
3.根据权利要求2所示的基于Xgboost算法的交通量预测方法,其特征在于,所述分为若干不同时间间隔的交通量数据具体指分为30分钟、60分钟两个不同间隔的交通量数据。
4.根据权利要求1所示的基于Xgboost算法的交通量预测方法,其特征在于,所述步骤S3具体包括:
输入Xgboost模型参数,采用时间窗步长参数对输入数据进行处理,将前n个时刻的交通量数据输入训练好的Xgboost模型,生成下一时刻的交通量数据预测结果,即n+1时刻的交通量。
5.根据权利要求1所示的基于Xgboost算法的交通量预测方法,其特征在于,所述步骤S4具体包括:
采用训练好的Xgboost模型对预测数据进行交通量预测,将预测数据同实际数据进行误差计算,误差计算采用均方误差和均方根误差作为评估指标,还原预测数据进行输出:
均方误差:
均方根误差:
式中:n是数据集个数,代表预测数据,yi代表真实数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910756049.2/1.html,转载请声明来源钻瓜专利网。