[发明专利]基于机器学习决策树的公交车乘客下车站点推断方法在审
| 申请号: | 202010017052.5 | 申请日: | 2020-01-08 |
| 公开(公告)号: | CN111275241A | 公开(公告)日: | 2020-06-12 |
| 发明(设计)人: | 刘春凤;赵勋;李智 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/30;G06F16/215;G06F16/2458;G06F16/28;G06F16/29;G06K9/62;G06N20/00 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 机器 学习 决策树 公交车 乘客 下车 站点 推断 方法 | ||
本发明公开了一种基于机器学习决策树的公交车乘客下车站点推断方法,主要通过IC卡刷卡数据和公交GPS数据匹配得到乘客刷卡数据的上车站点,再通过乘客的出行特征将乘客进行分类,通过将部分乘客的出行数据进行监督学习,其中每一个条出行数据都可以用一组属性来描述,每一条出行数据属于一个互斥的类别中的某一类,通过监督学习,找到从属性值到类别的映射关系,并能够为新的乘客出行数据进行分类来推断乘客的下车站点。本发明解决了公交乘客下车站点未知的问题,提升了现有下车站点预测方法的准确率。
技术领域
本发明涉及公共交通领域,尤其涉及一种基于机器学习决策树的公交车乘客下车站点 推断方法。
背景技术
随着经济全球化的迅猛发展,城市化程度逐渐增强,城市人口飞速增长,人们的出行 需求也随之增加,城市规模的不断扩大与飞速增长的出行需求之间的矛盾日渐加剧。虽然 私家车的数量与日俱增,但随着而来的是交通拥堵、空气污染以及非再生能源的加速枯竭 问题,而通过发展公共交通可以从根本上解决这一问题,从运输能力、通行效率以及道路 资源占有率方面公共交通系统具有绝对的优势,这就要求将公共交通的发展建设放到城市 建设的首要位置来。
随着政府加大力度发展公共交通,城市的基础设施建设不断进行,公交网络系统逐步 趋于完善,并且公交网络系统随着城市规模的扩大不断发生快速变化,以天津市城市公共 交通系统为例,天津市在发展城市公共交通上尤为重视,将发展公共交通作为一项利国利 民的民生工程,公共交通在该城市显得尤为重要,越来越多的人外出时会优先选择乘坐公 交车出行。公交网络的定义一般是指在一定地域范围内所有以公共交通线路为边和以交通 枢纽为节点的网络。同时公共交通运输部门不仅需要参考实际的乘客出行需求,而且要实 时地设计和完善满足这些出行需求的公交运输系统,这不仅仅包括公交运输调度系统设计 以及公交运输的线路网络的优化,同时要根据实际的交通运输需求及时高效地反映到公交 网络调整以及线路优化中。
到目前为止,天津市已部署运行公交车线路多达600条,运营线路总长度约13500公 里,公交车数量超过10000部,每日选择乘坐公交车出行的人次达600万左右。在这种海量的并且复杂的出行需求的情况下,出行的乘客以及运行的公交车每天都会产生大量的数据信息,这些产生的数据具有实时产生、规模海量等特点。如何对这些海量的数据进行数据筛选、数据提取和数据挖掘,将对我们有用的数据挖掘出来,实现数据的利用价值,这 对改善公共交通系统的运营及优化以及其商业化应用具有深远意义。
发明内容
本发明提供了一种基于机器学习决策树的公交车乘客下车站点推断方法,本发明通过 IC卡刷卡数据和公交GPS数据匹配得到乘客刷卡数据的上车站点,再通过乘客的出行特 征将乘客进行分类,通过将部分乘客的出行数据进行监督学习,其中每一个条出行数据都 可以用一组属性来描述,每一条出行数据属于一个互斥的类别中的某一类,通过监督学习, 找到从属性值到类别的映射关系,并能够为新的乘客出行数据进行分类来推断乘客的下车 站点。并以天津市公交系统为例,利用该方法推断出公交下车站点占比75.36%,推断结果 可以得到乘客的OD站点分布以及为大规模乘客出行规律研究提供有力基础,并为进一步 获得乘客出行规律提供了有力依据。旨在解决了公交乘客下车站点未知的问题,提升了现 有下车站点预测方法的准确率。以及为公交线路优化以及公交系统调度优化提供数据依 据,提高公共交通的资源利用率,详见下文描述:
一种基于机器学习决策树的公交车乘客下车站点推断方法,所述方法包括以下步骤:
根据车辆位置信息与公交系统中的线路位置数据相匹配,获取最终的上车站点;
机器学习训练集的获取,通过IC卡和GPS数据相结合的方法获取训练集;
应该决策树C4.5算法对未知乘客的下车站点进行预测;
将预测过程种的决策树进行剪枝处理;防止推断中出现过拟合现象;
最后预测未知的乘客刷卡数据的下车站点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010017052.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





