[发明专利]一种行为轨迹的表示、查询方法及装置有效
申请号: | 201510175195.8 | 申请日: | 2015-04-14 |
公开(公告)号: | CN104834679B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 许佳捷;周晓方;郑凯;李直旭;赵朋朋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种行为轨迹的表示、查询方法及装置,本发明预先采用LDA主题模型学习得到每个关键字在主题空间中的概率分布,通过聚集函数生成每个查询的文本描述的主题分布,对于给定的两个文本信息,可以通过它们的高维度主题分布来度量其语义的相似性。本发明能够在语义层次度量行为轨迹和查询意图的相关性,解决了传统信息检索文本相似性度量过度依赖于“形”的缺陷,并且本发明通过主题分布能够对文本描述进行有效理解。本发明还提供了一种行为轨迹的查询方法,基于文本描述的主题分布利用主题空间层和地理空间层协同搜索机制对给定文本描述进行搜索,提高查询效率和精度,以便为用户推荐更加精确的轨迹。 | ||
搜索关键词: | 一种 行为 轨迹 表示 查询 方法 装置 | ||
【主权项】:
一种行为轨迹的表示方法,其特征在于,包括:获取用户查询的目标文本描述和预设LDA主题模型的轨迹文本描述,其中所述轨迹文本描述在所述预设LDA主题模型中对应一个模型主题分布;将所述目标文本描述输入至所述预设LDA主题模型,经所述预设LDA主题模型计算后输出目标主题分布,所述预设LDA主题模型包括多个主题分布,以及,与每个主题分布对应的多个轨迹文本描述;利用相似性函数计算表征所述目标主题分布,与,所述模型主题分布的语义相关性的相似性函数值;所述目标主题分布和所述模型主题分布的语义相关性,与,所述相似性函数值成反比;其中,所述将所述目标文本描述输入至所述预设LDA主题模型,经所述预设LDA主题模型计算后输出目标主题分布包括:对于所述目标文本描述w,通过预先构建的维护矩阵β计算目标文本描述w对应的所述目标主题分布TDW,TDW是一个高维向量共有|Z|个分量,其中,分量TDW[j]代表了目标文本描述w与主题zj的相关性,该分量通过以下公式计算:TDW[j]=Σki∈wfreq(ki,w)×β[i][j]Σki∈wfreq(ki,w)]]>其中,freq(ki,w)表示关键字ki在文本w中出现的次数,β[i][j]表示关键字ki与主题zj的相关性;通过上述公式计算目标文本描述w与每个主题的相关性、作为所述目标主题分布的每个分量,得到目标文本描述w的目标主题分布TDW。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510175195.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种二级索引建立方法和装置
- 下一篇:基于区间的模糊数据库搜索