[发明专利]对出行链断链时公交IC卡乘客进行下车站点识别的方法有效
| 申请号: | 202011593440.4 | 申请日: | 2020-12-29 |
| 公开(公告)号: | CN112733891B | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 王成;崔紫薇;张烜榕 | 申请(专利权)人: | 华侨大学 |
| 主分类号: | G06F18/27 | 分类号: | G06F18/27;G06F18/23213;G06F18/22;G06Q10/047;G06Q50/26 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;杨锴 |
| 地址: | 362000 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 出行 链断链时 公交 ic 乘客 进行 下车 站点 识别 方法 | ||
本发明涉及一种对出行链断链时公交IC卡乘客进行下车站点识别的方法,综合使用集计模型和非集计模型的基于两层Stacking框架。在第一层Stacking框架中提出一种基于群体历史记录的方法来进行改善下车站点的识别概率,弥补基于个人历史记录方法中个人历史出行记录较少的缺点。在第二层Stacking框架中使用Logistic回归模型,对于不同数据集可以有效确定第一层中各方法的权重,得到的模型参数更适合该数据集,具有更好的泛化能力,对识别的准确率产生了有益的影响。本发明能够识别全部出行链断裂时IC卡数据的下车站点;在第二层中使用Logistic回归模型来确定第一层多个方法的不同权重,并且权重可以根据不同的数据集进行调整,具有更好的泛化能力,进而具有更高的准确率。
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种对出行链断链时公交IC卡乘客进行下车站点识别的方法。
背景技术
公交IC卡乘客的下车站点数据是公交客流预测、公交线网优化、车辆调度和系统评价等研究的重要基础数据。
目前,常规的公交下车站点的推算方法可主要分为两种:集计模型和非集计模型。
集计模型的研究对象为群体,可以确定每个站点的下车人数。常见的方法为基于公交站点的站点吸引权法,基于居民公交出行距离、站点周边用地性质影响以及站点吸引强度等影响因子,利用下车概率理论来计算各站点的下车人数。但是,集计模型不能判断单个乘客的下车站点。
非集计模型的研究对象为个人,可以确定每位乘客的下车站点。最经典的方法是每张卡每天有多条刷卡记录、出行链闭合时的基于出行链理论的方法。其基本思想是通过后一次出行上车站点的刷卡时间和站点位置来寻找前次出行的下车站点。对某张卡某天的最后一条刷卡记录,有些研究假设目的地接近当天或第二天的首次上车站点,以此来确定最后一条记录的下车站点。事实上,一些乘客并不经常乘坐公共交通工具,出行也不能形成一个封闭的出行链,因此无法通过上述方法确定出行链断裂时的目的地。当每张卡一天只有一次刷卡记录时,也无法用基于出行链的方法确定下车站点。
在乘客公共交通出行链不完整的情况下,一些学者将用出行链方法确定目的地的记录作为个人历史集合进一步研究,他们将出行分为工作日和非工作日两种情况,分别在个人历史记录中找到相似记录,然后计算每个可能下车站的上车频率,选择频率最高的站作为目的地。
一些学者从时间和空间两方面分析得到各站点的下车概率,并由时间概率和空间概率相乘确定最大概率的下车站点为目的地。此外,还确定了一个推算下车站点与准确下车站点之间距离的合适阈值。但是,这些方法都不能对全部刷卡数据进行下车站点推算。
一些学者提出了一种基于两步的算法解决这个问题。其中第一步为基于出行链方法等确定性模型,第二步为对于出行链断裂的数据基于若干特征和机器学习算法进行确定下车站点。并且,这个研究基于K-Means聚类将乘客分为了若干群体,并且对每一个群体分别确定下车站点来提高准确度。
上述方法为单独地从集计模型或者非集计模型角度进行分析。
一些学者将乘客的个体出行特征融入站点吸引权重计算的概率模型,并确定了实例中所有记录的下车站点。首先,用出行链的方法确定下车站点。然后,选择个人上车频率最高的可能下车站点作为目的地。最后,计算每个可能下车站点的上车客流占全部可能下车站点上车客流的比例,由此将下车站点随机按比例分配到每条记录中。
现有技术中,基于KNN的方法、基于决策树的方法、基于随机森林的方法是非集计模型,这三种机器学习算法皆需要基于出行链方法等确定模型已识别下车站点的数据作为训练集进行模型的训练,并且现有研究中选择IC卡信息、IC卡记录上车站点、上车时刻、土地利用性质等信息作为三种算法的输入。
基于KNN的方法直接根据若干特征,确定和待识别下车站点记录最相似的若干条数据来识别下车站点,但方法中最近邻样本数值的选取通常较为主观、缺乏客观依据,会造成与待识别下车站点记录相似数据集难以确定,降低准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011593440.4/2.html,转载请声明来源钻瓜专利网。





