[发明专利]载客热点并行预测方法、系统、终端及计算机存储介质在审
| 申请号: | 202010857329.5 | 申请日: | 2020-08-24 |
| 公开(公告)号: | CN112070529A | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 夏大文;郑永玲;白宇;蒋顺英;杨楠;李华青;高晓楠;冯夫健;严晓波;魏嘉银;张乾;梁燕军;王林 | 申请(专利权)人: | 贵州民族大学 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/30;G06F16/29;G06F16/2458;G06K9/62 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 陈启天 |
| 地址: | 550025 贵*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 载客 热点 并行 预测 方法 系统 终端 计算机 存储 介质 | ||
本发明公开了一种载客热点并行预测方法、系统、终端及计算机存储介质,方法包括:获取车辆的移动轨迹数据;对移动轨迹数据进行预处理,获得乘客热点数据;根据乘客热点数据构建并行GS‑SVM算法;基于RDD执行GS‑SVM算法,并输出预测结果;即获得移动轨迹数据预处理后获取乘客热点数据,进而构建并行GS‑SVM算法,再结合Spark下RDD实现并行GS‑SVM算法,利用GS‑SVM算法捕捉非线性信息的能力,输出预测结果,有效提高预测精确性、鲁棒性和实时性,解决了移动轨迹大数据的分布式存储和并行计算的技术问题。
技术领域
本发明涉及基于移动轨迹大数据的乘客热点预测领域,尤其涉及一种载客热点并行预测方法、系统、终端及计算机存储介质。
背景技术
在大数据驱动的智能交通时代,乘客热点预测对于驾驶员(如出租车司机)盈利至关重要,是利用历史乘客热点上客数对未来时间间隔乘客热点进行预测,进而帮助驾驶员快速寻找乘客,缩短巡航时长、降低成本开支、减少能源消耗与环境污染。
传统的乘客热点预测算法存在预测精度低、适应性差等缺陷,尤其是随着交通大数据的爆炸式增长,现有串行算法在基于传统单机集中式计算平台的乘客热点预测时仍存局限,极易导致内存消耗、I/O开销高、处理效率低和可扩展性能差的技术问题。同时,现有技术在乘客热点预测中仅考虑线性关系,导致预测精度低的技术问题。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种载客热点并行预测方法、系统、终端及计算机存储介质,具有预测精度高、处理速度快、可扩展性强等特点,能有效解决基于移动轨迹大数据的乘客热点分布式存储和并行计算存在的内存消耗高、计算耗时的技术问题。
本发明解决上述技术问题的技术方案如下:一种载客热点并行预测方法、系统、终端及计算机存储介质,包括以下步骤:
获取车辆的移动轨迹数据;
对所述移动轨迹数据进行预处理,获得乘客热点数据;
根据所述乘客热点数据构建并行GS-SVM算法;
基于RDD执行所述GS-SVM算法,并输出预测结果。
本发明的有益效果是:获得移动轨迹数据,在预处理后获取乘客热点数据,进而构建并行GS-SVM算法,再结合Spark下RDD实现所述并行GS-SVM算法,利用GS-SVM算法捕捉非线性信息的能力,输出预测结果,有效提高预测精确性、鲁棒性和实时性,解决了移动轨迹大数据的分布式存储和并行计算的技术问题。
进一步,所述对所述移动轨迹数据进行预处理,获得乘客热点数据包括:
根据所述移动轨迹数据提取所述车辆运营状态从0变为1的轨迹数据,并保存运营状态为1的轨迹数据,所述0表示空车,所述1表示载客;
根据所述运营状态为1的轨迹数据,对路网进行网格划分;
统计所述网格内预设时间间隔内运营状态为1的轨迹数据,获得乘客热点数据。
采用上述进一步方案的有益效果是,将所述移动轨迹大数据依次进行数据提取、数据排序、路网网格化和数据统计,通过在Hadoop分布式计算平台下,基于Spark并行处理框架解决了移动轨迹大数据的分布式存储和并行计算存在的内存消耗高、计算耗时的技术问题。
进一步,所述根据所述移动轨迹数据提取所述车辆运营状态从0变为1的轨迹数据,并保存运营状态为1的轨迹数据包括:
通过读取HDFS文件中的移动轨迹数据,将移动轨迹数据转换为Spark中的RDD弹性分布数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州民族大学,未经贵州民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010857329.5/2.html,转载请声明来源钻瓜专利网。





