[发明专利]一种基于时域特征的查询词自动补全方法与装置在审
| 申请号: | 201710273064.2 | 申请日: | 2017-04-19 |
| 公开(公告)号: | CN107169045A | 公开(公告)日: | 2017-09-15 |
| 发明(设计)人: | 蔡飞;陈洪辉;蒋丹阳;刘俊先;罗爱民;陈涛;舒振;罗雪山 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京市铸成律师事务所11313 | 代理人: | 郝文博,王建秀 |
| 地址: | 410003 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时域 特征 查询 自动 方法 装置 | ||
1.一种基于时域特征的查询词自动补全方法,其特征在于,包括:
获取查询日志,并基于时域特征预测查询日志中每个查询词的未来查询次数;
采集查询词前缀,并根据查询词前缀与查询日志生成补全查询词集合;
根据补全查询词集合中每个查询词的未来查询次数确定其查询次数得分;
使用移动平均方法根据查询日志获得补全查询词集合中每个查询词基于时域特征的激增幅度,并根据激增幅度确定其激增幅度得分;
根据补全查询词集合中每个查询词的查询次数得分、激增幅度得分与折中因子获得排序得分,并根据排序得分对补全查询词集合中的每个查询词排序显示;
当查询词前缀发生变化时,执行以上步骤重新生成补全查询词集合、计算排序得分并动态更新排序显示。
2.根据权利要求1所述的方法,其特征在于,所述基于时域特征预测查询日志中每个查询词的未来查询次数包括:
从查询日志中获取过去每个查询词按日计算的查询次数;
对过去每个查询词按日计算的查询次数使用离散傅里叶变换,生成傅里叶级数的频域系数;
根据傅里叶级数的频域系数生成周期图并取到最大值;
获取周期图最大值的频率,并根据最大值频率确定过去每个查询词的主要周期;
根据查询日志中获取过去每个查询词按日计算的查询次数与其主要周期预测查询日志中每个查询词的未来查询次数。
3.根据权利要求1所述的方法,其特征在于,所述根据查询词前缀与查询日志生成补全查询词集合包括:
根据查询词前缀在查询日志中检索符合查询词前缀的查询词;
将符合查询词前缀的查询词按其未来查询次数由大到小进行排序,并从序列头开始截取指定数量的查询词生成补全查询词集合。
4.根据权利要求1所述的方法,其特征在于,所述根据补全查询词集合中每个查询词的未来查询次数确定其查询次数得分包括:
根据补全查询词集合中每个查询词的未来查询次数确定其均值与标准差;
根据补全查询词集合中每个查询词的未来查询次数、均值与标准差确定补全查询词集合中每个查询词的查询次数得分。
5.根据权利要求1所述的方法,其特征在于,所述使用移动平均方法根据查询日志获得补全查询词集合中每个查询词基于时域特征的激增幅度包括:
从查询日志中获取过去每个查询词按日计算的查询次数;
对过去每个查询词按日计算的查询次数使用移动平均方法,以固定大小的滑动窗口在整个序列上滑动并计算移动平均值,生成移动平均序列;
根据移动平均序列预测下一个移动平均值;
计算移动平均序列中每个移动平均值的均值与标准差,并根据移动平均值的均值、标准差、以及去噪因子,获得激增截止点;
根据激增截止点与下一个移动平均值获得补全查询词集合中每个查询词基于时域特征的激增幅度。
6.根据权利要求5所述的方法,其特征在于,所述滑动窗口内数据的平均值为未加权的移动平均值;或所述滑动窗口内数据的平均值为具有衰减函数加权的移动平均值,其中,衰减函数对较旧的数值相比于较新的数值产生更强的权重衰减,且衰减函数是归一化函数。
7.根据权利要求5所述的方法,其特征在于,所述根据激增幅度确定其激增幅度得分包括:
根据补全查询词集合中每个查询词的激增幅度确定其均值与标准差;
根据补全查询词集合中每个查询词的激增幅度、均值与标准差确定补全查询词集合中每个查询词的激增幅度得分。
8.根据权利要求1所述的方法,其特征在于,所述根据补全查询词集合中每个查询词的查询次数得分、激增幅度得分与折中因子获得排序得分,为使用折中因子调整每个查询词的查询次数得分与激增幅度得分二者所占权重获得排序得分。
9.根据权利要求8所述的方法,其特征在于,所述折中因子为预先指定的常数,或根据移动平均序列中每个移动平均值的均值与下一个移动平均值的取值而变化的函数。
10.一种电子设备,其特征在于,包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1‐9中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710273064.2/1.html,转载请声明来源钻瓜专利网。





