[发明专利]一种基于度量学习的用户轨迹相似性度量方法有效
申请号: | 201710847477.7 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107679558B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 邵俊明;刘松灵;杨勤丽;于忠靖;朱庆 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户轨迹 度量 相似性度量 相似性矩阵 相似性度量函数 矩阵 学习 概率分布矩阵 度量函数 方法生成 类别集合 时间联合 用户分布 用户偏好 聚类 散度 维度 向量 | ||
本发明公开了一种基于度量学习的用户轨迹相似性度量方法,结合度量学习方法通过计算用户轨迹距离得到用户轨迹之间的相似性。首先生成每个用户的地点‑时间联合概率分布矩阵。接下来通过KL散度计算基于用户分布矩阵的不同用户轨迹之间的初始相似性,并通过谱聚类的方法生成用户轨迹的初始类别(即将用户轨迹按照相似性矩阵划分为不同的类别,以便利于后续的相似性度量函数计算)。最后在初始相似性矩阵S和轨迹初始类别集合C基础上,结合度量学习技术,获取具备用户偏好模式且具有相同维度的用户轨迹的相似性表征向量和度量函数数,在此基础上,计算用户轨迹之间的距离,得到用户轨迹相似性。
技术领域
本发明属于轨迹相似性度量技术领域,更为具体地讲,涉及一种基于度量 学习的用户轨迹相似性度量方法。
背景技术
随着定位卫星、个人定位设备和无线网络的发展,用户轨迹数据呈现出爆 发式的增长。考虑到用户轨迹数据挖掘潜在的社会价值,这一技术领域越来越 受到各界的关注,尤其是计算机科学、地理信息科学和社会科学等领域。同时, 在产业界,用户轨迹数据的分析和挖掘为各个领域创造了巨大的商业价值。例 如,交管部门可以通过对交通流量数据进行分析以达到规避出行高峰城市拥堵 现象,解决类似城市交通和城市环境问题;涉及用户出行业务的企业可通过对 用户轨迹数据进行数据挖掘并建立有效模型,解决用户出行路径规划、近邻用 户推荐、优化接客地点等问题。
在用户轨迹数据挖掘算法中,往往都涉及到对用户轨迹相似性的度量,如 轨迹聚类、轨迹预测、异常轨迹检测等。用户轨迹相似性度量是用户轨迹数据 挖掘中的核心技术,具有重要的理论和应用价值。目前的用户轨迹相似性度量 主要分为在时空空间和特征空间进行度量。
在时空空间里,由于用户轨迹具有时间特性,相似性度量方法常将时间序 列的相似性度量方法由“时间-属性”序列扩展到“时间-空间-属性”的三维时空序 列,如最大公共子序列、动态时间规整、最小编辑距离等方法。这类方法的共 有缺陷在于将用户轨迹中所有坐标和时间信息等同考量,忽略了用户轨迹中存 在的某些关键地点或时间信息。而其中一些相似性度量方法仅考虑了坐标信息, 而用户轨迹本身具有的时空紧耦合性,使其无法对用户轨迹的相似度进行有效 度量。
在特征空间中,其基本思想是提取用户轨迹的中一些固有特征,如用户轨 迹的速度、曲率、长度和起始点等。这种方法依赖于专家知识,容易使得特征 之间存在极大冗余度,同时遗漏掉用户轨迹与用户轨迹间的关键区分度信息。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于度量学习的用户轨 迹相似性度量方法,生成用户轨迹全局性的、具有用户偏好模式的且特征维度 一致的相似性表征。
为实现上述发明目的,本发明基于度量学习的用户轨迹相似性度量方法, 其特征在于,包括以下步骤:
(1)、用户移动数据收集与整理清洗
收集用户移动数据,根据分析需求对用户移动数据进行整理清洗:采用关 键地点信息提取技术(即POI,Point of Interest,关键地点或兴趣点)对隐藏在 用户移动数据中关键地点的时间位置信息进行提取,得到用户基于关键地点的 轨迹表征;
(2)、用户地点-时间联合分布计算
首先利用聚类算法(如DBSCAN)对全体用户的关键地点时间位置信息进 行聚类,获取热点区域,再结合城市已知关键地点的位置信息,得到全体用户 高频访问的关键地点,提取排名靠前也就是更多被访问的P个关键地点作为用 户轨迹趋向访问的地点。
对整个用户活动时间,按照其在时间维度上的分布进行动态划分,得到T 个时间段,基于用户轨迹趋向访问地点和时间段划分,对每个用户,得到其地 点-时间联合概率分布矩阵i=1,2,…,m,m为用户数量,该矩阵直接反映 每位用户轨迹在空间维度和时间维度上的分布情况;
(3)、用户轨迹初始相似性矩阵获取
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710847477.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能一体化供水设备
- 下一篇:太阳能电池片掰片设备