[发明专利]一种基于复合元路径的相似出行者识别方法有效
申请号: | 201810155791.3 | 申请日: | 2018-02-23 |
公开(公告)号: | CN108256590B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 唐蕾;赵亚玲;陈君;杨祎祯;贾景池 | 申请(专利权)人: | 长安大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710064 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似性计算 出行网络 出行 复合 相似性度量 路径集合 潜在用户 算法实现 查全率 查准率 差异化 语义性 单条 异构 直观 时空 预测 群体 发现 服务 | ||
1.一种基于复合元路径的相似出行者识别方法,其特征在于,包括以下步骤:
步骤一:对GPS数据进行预处理,包括位置停留点聚类识别、时间序列化模糊处理以及访问服务语义扩展,转换成包括出行用户编号、用户出行时间段、用户停留点位置,以及停留点访问类型的数据;
步骤二:对异构信息网络进行扩展,得到异构出行网络模型,并且采用用户、用户停留点、停留点访问类型、出行时间段作为异构出行网络模型节点;其中,异构出行网络模型的边缘是在节点类型之间构建的,节点之间的语义关系分别为:连接用户和停留点,表明用户停留在一个确定的地方;连接停留点和服务,表明用户在停留点访问的服务类型;连接停留点和时间,表明用户停留在停留点的时间段;并且异构出行网络模型采用六元组表示;
步骤三:构造小于4个节点数的出行元路径,由小于4个节点数的出行元路径构成对称元路径集;
步骤四:通过计算异构出行网络模型中元路径特征,通过出行相似性度量算法确定出行行为的相似度;
其中,异构出行网络模型的六元组表示,其中:
(1)为出行用户节点集合;
(2)为停留点节点集合;
(3)为在停留点访问服务的类型集合;
(4)为出行时间序列集合;
(5)是异构出行网络模型中所有边的集合,其中,描述了用户与地点之间的语义关系,即用户在地点停留;,其蕴含了地点与服务种类之间的语义联系,即用户在地点停留且使用其提供的服务种类;描述了时间段与地点之间的语义关系,即用户在时间段内停留;
(6)是异构出行网络模型中边的权值集合,其中,度量了用户出现在某个停留点的次数;标识停留点提供的服务种类个数;确定在一个时间段内出现的停留点个数。
2.根据权利要求1所述的一种基于复合元路径的相似出行者识别方法,其特征在于,步骤四具体过程如下:
首先,通过样本训练确定出行用户与的相似状态,然后根据步骤三得到的对称元路径集,利用Pathsim方法产生元路径集上的一个特征向量
,
基于逻辑回归模型可知,两个用户的相似性预测结果如公式(2)
(2)
其中,向量代表训练集中的用户与的相似性,其值为0或1,0代表不相似,1代表相似,为权值向量。
3.根据权利要求2所述的一种基于复合元路径的相似出行者识别方法,其特征在于,利用Pathsim方法产生元路径集上的特征向量中的一个特征值的具体过程如下:
采用如下式(1)得到:
,(1)
其中,表示用户与之间的元路径数,,分别表示与连接自身之间的元路径数;Eul(x,L)与Eul(y,L),分别表示和到达特定地点L的元路径集合,为其相应权值;表示与到达相同地点的元路径集合;和分别表示和访问特定位置的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长安大学,未经长安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810155791.3/1.html,转载请声明来源钻瓜专利网。