[发明专利]不同城市热度值的预测方法、模型训练方法及系统在审
申请号: | 201911376422.8 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111127109A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 黎建辉;柳影波;郭海山 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/12;G06N20/20;G06N20/00;G06N7/00;G06N5/00 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 不同 城市 热度 预测 方法 模型 训练 系统 | ||
1.一种用于出行数据预测的模型训练方法,其特征在于,包括下述步骤:
获取OTA平台关于多个目标城市的历史出行数据,所述历史出行数据包括历史出行人数数据或者历史酒店间夜量数据;
从所述历史出行数据中提取出特征数据,所述特征数据包括城市特征、日期特征、时间特征及同期历史表现特征,当所述历史出行数据包括历史酒店间夜量数据时,所述特征数据还包括规模特征,所述规模特征包括所述酒店位于的目标城市的商圈数量、所述酒店位于的目标城市的酒店数量及所述酒店的历史间夜量等级;
将所述特征数据划分为训练集及预测集;
将所述训练集中的特征数据输入至深度机器学习模型中进行训练;
将所述预测集中的特征数据输入至训练后的深度机器学习模型中进行预测以得到预测出行数据;
判断预测出行数据与真实出行数据的相对误差是否小于误差阈值,若是,则训练后的深度机器学习模型为出行数据预测模型。
2.如权利要求1所述的模型训练方法,其特征在于,所述深度机器学习模型包括两层机器学习器,且第一层机器学习器的输出作为第二层机器学习器的输入;
将所述训练集中的特征数据输入至深度机器学习模型中进行训练的步骤包括;
将训练集中的特征数据输入至第一层机器学习器进行训练;
将预测集中的特征数据输入至训练后的第一层机器学习器进行预测以得到第一预测数据;
将所述第一预测数据划分为第一训练集及第一预测集;
将第一训练集中的第一预测数据输入至第二层机器学习器进行训练;
将所述预测集中的特征数据输入至训练后的深度机器学习模型中进行预测以得预测出行数据的步骤包括:
将第一预测集中的第一预测数据输入至训练后的第二层机器学习器进行预测以得到预测出行数据。
3.如权利要求2所述的模型训练方法,其特征在于,所述第一层机器学习器包括若干深度机器学习模型,
将所述训练集中的特征数据输入至深度机器学习模型中进行训练的步骤包括:
将训练集中的特征数据分别输入至所述第一层机器学习器中的每一深度机器学习模型进行训练;
将预测集中的特征数据分别输入至训练后的所述第一层机器学习器中的每一深度机器学习模型进行预测以得到若干第一预测数据;
将若干第一数据划分为多维第一训练集及多维第一预测集;
将多维第一训练集中的若干第一预测数据输入至所述第二层机器学习器中的深度机器学习模型进行训练;
将第一预测集中的第一预测数据输入至训练后的第二层机器学习器进行预测以得到预测出行数据的步骤包括:将多维第一预测集中的若干第一预测数据输入至训练后的所述第二层机器学习器中的深度机器学习模型进行预测以得到预测出行数据。
4.如权利要求3所述的模型训练方法,其特征在于,所述第一层机器学习器包括Xgboost模型、LightGBM模型、BayesianRidge模型、DecisionTreeRegressor模型及RandomForestRegressor模型;
和/或,
所述第二层机器学习器包括Xgboost模型。
5.一种不同城市热度值的预测方法,其特征在于,所述预测方法包括:
将待预测目标城市输入至利用权利要求1-4中任意一项所述的训练方法训练出的所述出行数据预测模型以获取在未来日期预设范围内所述待预测目标城市每天的出行数据,所述出行数据包括到达人数数据或者酒店间夜量数据;
将所述出行数据输入至预设映射函数以得到待预测城市的热度值等级;
所述映射函数包括若干热度值等级,每一热度值等级与一出行数据范围对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911376422.8/1.html,转载请声明来源钻瓜专利网。