[发明专利]一种基于张量的用户轨迹挖掘方法有效
| 申请号: | 201510222590.7 | 申请日: | 2015-05-04 |
| 公开(公告)号: | CN104850604B | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 余辰;金海;洪钦敏;姚德中 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 张量 用户 轨迹 挖掘 方法 | ||
1.一种基于张量的用户轨迹数据挖掘方法,其特征在于,所述方法包括如下步骤:
(1)获取用户的历史轨迹数据;
(2)将历史轨迹数据中时间差超过设定时间阈值的数据分割,形成多段连续的轨迹数据;
(3)针对每段连续的轨迹数据,提取用户在每段轨迹上的停留点;
(4)针对步骤(3)获得的一对对停留点,将有先后时间关联关系的停留点划分为起始点和目的点,起始点和停留点之间是一串连续的GPS点,运用地图匹配方法,将GPS点对应到真实的道路交通网络上从而匹配到对应的道路路段上,获得对应的起始点和目的点之间的关联路段序列;
(5)将用户的出发点作为第一维度的数据,将用户的目的点作为第二维度的数据,将用户轨迹过程对应的路段作为第三维度的数据,构建一个三维的张量来表示用户的历史轨迹数据;
(6)对于一个用户查询请求,用户查询请求包含的信息有QueryS和QueryD,QueryS表示用户查询的起始点,QueryD表示用户查询的目的点;对QueryS附近的起始点进行聚类,按照与QueryS的距离不同赋予不同的权重向量,获得关于起始点的权重向量VS;对QueryD附近的起始点进行聚类,按照与QueryD的距离不同赋予不同的权重向量,获得关于起始点的权重向量VD;运用获得的关于QueryS和QueryD的两个权重向量对张量进行降维处理获得热点路段权值集合;
(7)运用路线搜索方法检索QueryS到QueryD之间的路段集合,选择综合热点权值最高的路段集合作为推荐路径;
所述步骤(6)中对张量进行降维处理,具体为:
运用获得的关于QueryS和QueryD的两个权重向量对张量进行降维处理:
其中X表示步骤(5)中根据用户历史轨迹数据生成的三维张量,Vs表示对查询起始点QueryS进行聚类后的权重向量,表示X从第一维度展开与权重向量Vs进行张量积的数学运算;对X中所有的起始点S进行逐次循环累加,Vi表示第i个起始点所对应的权值,Xidr表示第i个起始点所对应的目的点和路段;
其中X表示步骤(5)中根据用户历史轨迹数据生成的三维张量,Vd表示对查询起始点QueryD进行聚类后的权重向量,表示X从第二维度展开与权重向量Vd进行张量积的数学运算;对X中所有的目的点D进行逐次循环累加,Vi表示第i个目的点所对应的权值,Xsir表示第i个目的点所对应的起始点和路段;
通过上述公式对X中与查询请求相近的历史记录进行路段访问频度的累加,最终获得热点路段权值集合{(Ri.id,Ri.weight)}。
2.如权利要求1所述的方法,其特征在于,所述步骤(6)中按照与QueryS的距离不同赋予不同的权重向量,具体为:
对第一维起始点的位置与QueryS进行比较,如果小于500米,权重为1,大于500米而且小于1000米权重为0.5。
3.如权利要求1所述的方法,其特征在于,所述步骤(6)中按照与QueryD的距离不同赋予不同的权重向量,具体为:
对第一维目的点的位置与QueryD进行比较,如果小于500米,权重为1,大于500米而且小于1000米权重为0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510222590.7/1.html,转载请声明来源钻瓜专利网。





