[发明专利]一种基于张量的用户轨迹挖掘方法有效
| 申请号: | 201510222590.7 | 申请日: | 2015-05-04 |
| 公开(公告)号: | CN104850604B | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 余辰;金海;洪钦敏;姚德中 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于张量的用户轨迹数据挖掘方法,包括:(1)获取用户的历史轨迹数据;(2)将历史轨迹数据中时间差超过设定时间阈值的数据分割,形成多段连续的轨迹数据;(3)针对每段连续的轨迹数据,提取用户在每段轨迹上的停留点;(4)将停留点划分为起始点和目的点,通过地图匹配方法获取对应的路段序列;(5)将停留点数据与路段序列组建成一个三维张量;(6)对于一个用户查询请求(S,D)找到起始点和目的点之间的关联热点路段;(7)根据路段权值集合计算出推荐的路径。本发明的结果为对于用户查询请求起始点与目的点之间的热点推荐路线,检索只需提供起始点和目的点的经纬度,用户不需理解后台隐含的数据结构。 | ||
| 搜索关键词: | 一种 基于 张量 用户 轨迹 挖掘 方法 | ||
【主权项】:
1.一种基于张量的用户轨迹数据挖掘方法,其特征在于,所述方法包括如下步骤:(1)获取用户的历史轨迹数据;(2)将历史轨迹数据中时间差超过设定时间阈值的数据分割,形成多段连续的轨迹数据;(3)针对每段连续的轨迹数据,提取用户在每段轨迹上的停留点;(4)针对步骤(3)获得的一对对停留点,将有先后时间关联关系的停留点划分为起始点和目的点,起始点和停留点之间是一串连续的GPS点,运用地图匹配方法,将GPS点对应到真实的道路交通网络上从而匹配到对应的道路路段上,获得对应的起始点和目的点之间的关联路段序列;(5)将用户的出发点作为第一维度的数据,将用户的目的点作为第二维度的数据,将用户轨迹过程对应的路段作为第三维度的数据,构建一个三维的张量来表示用户的历史轨迹数据;(6)对于一个用户查询请求,用户查询请求包含的信息有QueryS和QueryD,QueryS表示用户查询的起始点,QueryD表示用户查询的目的点;对QueryS附近的起始点进行聚类,按照与QueryS的距离不同赋予不同的权重向量,获得关于起始点的权重向量VS;对QueryD附近的起始点进行聚类,按照与QueryD的距离不同赋予不同的权重向量,获得关于起始点的权重向量VD;运用获得的关于QueryS和QueryD的两个权重向量对张量进行降维处理获得热点路段权值集合;(7)运用路线搜索方法检索QueryS到QueryD之间的路段集合,选择综合热点权值最高的路段集合作为推荐路径;所述步骤(6)中对张量进行降维处理,具体为:运用获得的关于QueryS和QueryD的两个权重向量对张量进行降维处理:
其中X表示步骤(5)中根据用户历史轨迹数据生成的三维张量,Vs表示对查询起始点QueryS进行聚类后的权重向量,
表示X从第一维度展开与权重向量Vs进行张量积的数学运算;对X中所有的起始点S进行逐次循环累加,Vi表示第i个起始点所对应的权值,Xidr表示第i个起始点所对应的目的点和路段;
其中X表示步骤(5)中根据用户历史轨迹数据生成的三维张量,Vd表示对查询起始点QueryD进行聚类后的权重向量,
表示X从第二维度展开与权重向量Vd进行张量积的数学运算;对X中所有的目的点D进行逐次循环累加,Vi表示第i个目的点所对应的权值,Xsir表示第i个目的点所对应的起始点和路段;通过上述公式对X中与查询请求相近的历史记录进行路段访问频度的累加,最终获得热点路段权值集合{(Ri.id,Ri.weight)}。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510222590.7/,转载请声明来源钻瓜专利网。





