[发明专利]用于挖掘个体活动模式的设备和方法有效
| 申请号: | 201310705722.2 | 申请日: | 2013-12-19 |
| 公开(公告)号: | CN104731795B | 公开(公告)日: | 2018-05-22 |
| 发明(设计)人: | 李曼;胡卫松 | 申请(专利权)人: | 日本电气株式会社 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 闫晔 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 挖掘 个体 活动 模式 设备 方法 | ||
提供了一种用于挖掘个体活动模式的设备,包括:计算单元,被配置为根据个体的历史位置数据来计算个体的停留点,形成包含停留时间的停留点序列;划分单元,被配置为根据个体活动的主题将停留点序列划分为相应的停留点序列片段;以及聚类单元,被配置为对划分后的停留点序列片段进行聚类,以获得个体活动模式。还提供了一种用于挖掘个体活动模式的方法。本发明可以挖掘出非固定长度内的个体活动模式,而且能挖掘出更全面的具有代表性的个体活动模式。
技术领域
本申请涉及数据分析领域,具体涉及一种用于挖掘个体活动模式的设备和方法。
背景技术
个体活动模式是指个体用户日常活动的特点的和规律性。基于个体的活动模式,可以将与用户相关的信息(例如交通信息)自动地提供给该用户。也可以基于个体的活动模式计算个体的相似性,将具有类似活动模式的个体分成一类,从而对该类个体推荐信息。
现有的个体活动模式挖掘方法是从个体每天的历史位置数据中找出停留时间大于指定阈值的位置作为停留点,然后分析该个体在各个停留点之间的转移规律,将频繁出现的停留点之间的转移规律抽取出来作为个体的活动模式。
然而,现有方法只考虑停留点之间的位置转移关系,没有考虑停留点的停留时间。实际上,停留时间对于停留点有非常重要的意义。比如说,一个在餐馆工作的厨师和一个经常去该餐馆吃饭的人可能有相似的历史轨迹,但是他们在该餐馆的停留时间差别很大。所以,停留时间对于更准确得分析个体的活动模式具有重要意义。
此外,现有挖掘方法没有考虑如何更合理的划分历史轨迹。具体地,现有挖掘方法通常以固定的时间长度作为分析单元(例如一天内的轨迹),这样会割裂跨固定时间长度(例如跨天)的有意义的个体活动模式。
进一步地,现有挖掘方法主要是基于历史的位置转移,挖掘频繁的位置转移规律作为个体的活动模式。然而,个体的实际活动具有多样性,即使从事同样的活动,其停留点序列也并不会每次都完全一样。例如,一个学生大部分时间的活动转移是宿舍->教室->运动场->食堂,但他偶尔会出现宿舍->教室->运动场->咖啡店,虽然频率不高。现有技术往往会将后者忽略。而实际上两种活动转移是类似的,区别只是在其中一个停留点(就餐位置)上有差异,但不影响该类活动的主题。
发明内容
为了解决上述技术问题,本发明考虑个体在每个停留点的停留时间,采用自适应的轨迹切分方法(即根据目标最优化的原则)将个体的个人历史轨迹切分成长度不固定的具有特定主题的时空轨迹片段,并采用聚类的方法对个体的活动序列进行分析,从而将相似但不完全相同的活动序列划分成同一类别。
具体地,根据本发明的第一方面,提供了一种用于挖掘个体活动模式的设备,包括:计算单元,被配置为根据个体的历史位置数据来计算个体的停留点,形成包含停留时间的停留点序列;划分单元,被配置为根据个体活动的主题将停留点序列划分为相应的停留点序列片段;以及聚类单元,被配置为对划分后的停留点序列片段进行聚类,以获得个体活动模式。
在一个实施例中,所述计算单元被配置为:对个体的历史位置数据进行聚类;计算个体在与特定类别相对应的区域中的停留时间;以及如果所述停留时间大于指定阈值,判断与所述特定类别相对应的区域是停留点。
在一个实施例中,所述划分单元被配置为:对每个停留点的主题分布和边界划分值进行初始化;以及迭代地调整每个停留点的主题分布和边界划分值,直到每个停留点的主题分布和所有的边界划分值变得稳定。
在一个实施例中,所述聚类单元被配置为:将每一个停留点序列片段用向量来表示,并且对所有的向量进行聚类,以获得个体活动模式。
在一个实施例中,所述计算单元被配置为:使用基于密度的聚类算法,对个体的历史位置数据进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310705722.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提取关键词的方法及装置
- 下一篇:一种桌面应用定制工具和方法





