[发明专利]查询意图挖掘的方法和系统有效
申请号: | 201410101649.2 | 申请日: | 2014-03-18 |
公开(公告)号: | CN103927328B | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 夏云庆;那森;黄耀海;赵欢 | 申请(专利权)人: | 清华大学;佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李迪 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 意图 挖掘 方法 系统 | ||
1.一种查询意图挖掘的方法,其特征在于,包括如下:
A、获取一个搜索查询;
B、识别该搜索查询中的关键概念;
C、识别所述关键概念中的数值类型;
D、对于每一个识别得到的所述数值类型,生成至少一个包含有数值查询结构的数值查询实例;
E、从数据源中挖掘与所述搜索查询相关且与至少一个步骤D中生成的所述数值查询实例同时出现的候选意图;
F、通过所述数值查询实例计算与其对应的所述候选意图的取值范围;
G、根据步骤F中计算得出的所述候选意图的取值范围对所述候选意图进行聚类;
H、输出所述候选意图的意图列表。
2.根据权利要求1所述的方法,其特征在于,所述数值类型包括周期、频度、距离、数量和水平。
3.根据权利要求1所述的方法,其特征在于,所述数值查询结构包括所述关键概念、所述数值类型以及实例数值。
4.根据权利要求3所述的方法,其特征在于,所述实例数值取最大值、最小值、确定值和间隔值四个类型之一。
5.根据权利要求3所述的方法,其特征在于,步骤D中,所述生成数值查询实例,包括:
D1、使用预设的数值集合,为每一个所述数值查询实例设定所述实例数值。
6.根据权利要求3所述的方法,其特征在于,所述生成数值查询实例,进一步包括:
D21、从预设的模式集中获取与所述数值类型相应的模式;
D22、使用步骤D21中获取的模式从数据源中挖掘所述数值查询实例。
7.根据权利要求1所述的方法,其特征在于,步骤E进一步包括:
E11、从数据源中检索与所述搜索查询相关的内容,且该内容至少包含一个数值查询实例;
E12、从每个步骤E11中检索出的所述搜索查询相关的内容中,根据预设的词库识别出候选意图;
E13、生成候选意图集,且所述候选意图至少与一个数值查询实例共现。
8.根据权利要求1所述的方法,其特征在于,步骤F进一步包括:
F11、计算每一个所述数值查询实例的取值范围;
F12、生成包含至少一个候选意图的数据集;
F13、对于步骤F12中生成的所述数据集中的每一个意图,计算该意图的取值分布以及权值,所述意图的取值等于该意图的权值除以整个数值查询实例集合所包含意图的权值总和,且求得的该意图的取值与权值均与该意图对应地置于所述数据集中;
F14、以所述候选意图的实例数值的最小值作为该候选意图的取值范围的左边界;
F15、以所述候选意图的实例数值的最大值作为该候选意图的取值范围的右边界;
F16、对每一个所述候选意图,计算其在取值范围内的总的分布值。
9.根据权利要求8所述的方法,其特征在于,步骤F11进一步包括:
F111、根据预设的数值类型,计算数值查询实例的取值范围。
10.根据权利要求8所述的方法,其特征在于,步骤F14进一步包括:
F1411、对每一个所述候选意图设定初始的取值范围,将整个所述数据集的最大值设为其左边界;
F1412、对于选定的具有最大分布值的所述候选意图,获取其实例数值;
F1413、如果当前的左边界值大于获取的实例数值,则将该实例数值设为左边界。
11.根据权利要求8所述的方法,其特征在于,步骤F15进一步包括:
F1511、对每一个所述候选意图设定初始的取值范围,将整个所述数据集的最小值设为其右边界;
F1512、对于选定的具有最大分布值的所述候选意图,获取其实例数值;
F1513、如果当前的右边界值小于获取的实例数值,则将该实例数值设为右边界。
12.根据权利要求8所述的方法,其特征在于,步骤F进一步包括:
F17、获取所述搜索查询的实例数值;
F18、当获取的所述搜索查询的实例数值小于候选意图的取值范围的左边界值,对该实例数值对应的候选意图取值范围的分布值设定最小值;
F19、当获取的所述搜索查询的实例数值在所述候选意图的取值范围内,对该实例数值对应的候选意图的分布值设定最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;佳能株式会社,未经清华大学;佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410101649.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:抗强光芒刺视片
- 下一篇:一种人体自身抗体联检试纸条及其制备方法