[发明专利]一种行为轨迹的表示、查询方法及装置有效
申请号: | 201510175195.8 | 申请日: | 2015-04-14 |
公开(公告)号: | CN104834679B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 许佳捷;周晓方;郑凯;李直旭;赵朋朋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行为 轨迹 表示 查询 方法 装置 | ||
技术领域
本发明涉及空间数据库领域,尤其涉及一种行为轨迹的表示、查询方法及装置。
背景技术
随着近年来移动互联技术的进步,基于移动端的社交网络(Mobile Social Networks)得到了爆炸式发展。上亿的用户通过智能手机在这些网站分享自己的位置信息,因而产生了大量的地理标记数据。例如,新浪微博用户可以向好友分享自己的位置、评论和照片;Foursquare允许用户对其访问的场馆进行签到和点评;Flickr对用户上传的照片做自动/手工的地理标注。从时空线索来看,这些序列化的带有位置信息的用户行为记录,可以被视为行为轨迹(Activity Trajectory)。例如,某用户发布的一序列带有位置信息的微博、Tweets等。
与传统的移动对象时空轨迹(Spatio-temporal Trajectory)不同,行为轨迹数据不光含有时间信息和空间信息,还蕴含着丰富的用户行为信息:人们所做的、想的、感受到的。所以人们提出:将各个用户的行为轨迹组成数据库,以便在其他用户需要时,系统可以通过数据分析和索引,为其推荐能够满足用户活动需求的服务。
现有的索引方法主要针对轨迹的时空特性,机械地将关键字视为文本字符,未能理解轨迹中用户行为的具体语义和联系,无法根据用户意图做准确的搜索和推荐。即现有的空间关键字处理技术在文本信息方面均注重于“形”,无法支持对行为描述的有效理解。例如:查询“喝咖啡”与轨迹描述“星巴克”被认为毫不相关,虽然他们的语义高度一致。
为了解决上述问题,需要提出一种行为轨迹的表示方法,克服现有技术中着重于“形”的缺陷,以便对行为描述进行有效理解。
发明内容
本发明提供了一种行为轨迹的表示、查询方法及装置,本发明能够克服现有技术中着重于“形”的缺陷,以便对行为描述进行有效理解。
本发明提出一种行为轨迹表示方法,预先采用LDA主题模型学习得到每个关键字在主题空间中的概率分布,通过聚集函数生成每个查询的文本描述的主题分布,对于给定的两个文本信息,可以通过它们的高维度主题分布来度量其语义的相似性。本发明能够在语义层次(即主题分布)度量行为轨迹和查询意图的相关性,解决了传统信息检索文本相似性度量过度依赖于“形”的缺陷,并且本发明通过主题分布能够对文本描述进行有效理解。
另外,在基于行为轨迹表示方法的基础上还提供了一种行为轨迹的查询方法,基于文本描述的主题分布利用主题空间层和地理空间层协同搜索机制对给定文本描述进行搜索,以便为用户推荐更加精确的轨迹。两个方案中对行为轨迹均采用主题分布表示,属于同一个发明构思,所以两个独立权利要求具有单一性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的一种行为轨迹的表示方法的流程示意图;
图2为本发明实施例公开的一种行为轨迹的表示方法中构建的TR2-Tree的示意图;
图3为本发明实施例公开的一种行为轨迹的查询方法的流程示意图;
图4为本发明实施例公开的一种行为轨迹的表示装置的结构示意图;
图5为本发明实施例公开的一种行为轨迹的查询装置的结构示意图。
具体实施方式
介绍本申请中所使用的简称:
LDA,Linear Discriminant Analysis,线性判别式分析;
MBR,Minimum bounding rectangle,最小外包矩形。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的行为轨迹通常被表示为附有位置和时间标签的文本描述序列,每个轨迹点由(loc,time,words)三元组表示,其中loc代表地理位置,time代表时间,words代表用户对活动的描述。但是这种轨迹表示通常用户基于文本相似性的检索,注重文本之间“形”的差别,例如查询“喝咖啡”与轨迹点描述“星巴克”被认为毫不相关,虽然他们的语义主题高度一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510175195.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二级索引建立方法和装置
- 下一篇:基于区间的模糊数据库搜索