[发明专利]一种时效性词的获取方法和装置有效
申请号: | 201110413881.6 | 申请日: | 2011-12-13 |
公开(公告)号: | CN103164424B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 郭瑞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 北京鑫媛睿博知识产权代理有限公司11297 | 代理人: | 龚家骅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时效性 获取 方法 装置 | ||
1.一种时效性词的获取方法,其特征在于,包括:
获取各搜索关键词在统计时段中的各单位时段内的搜索次数;
根据搜索关键词在统计时段中的各单位时段内的搜索次数,确定所述搜索关键词在所述统计时段中的搜索次数稳定度;
根据所述搜索次数稳定度,在各搜索关键词中确定与所述统计时段对应的时效性词;
其中,所述搜索关键词为服务器在当用户在网页输入搜索语句后获取所述用户输入的所述搜索语句,并对所述搜索语句进行分词处理得到的,所述服务器对应的记录用户搜索操作的时间;
所述根据搜索关键词在统计时段中的各单位时段内的搜索次数,确定所述搜索关键词在所述统计时段中的搜索次数稳定度,具体为:
根据搜索关键词在统计时段中的各单位时段内的搜索次数和所述搜索关键词在统计时段中的总搜索次数,确定所述搜索关键词在所述统计时段中的各单位时段内的搜索概率;
根据所述搜索关键词在所述统计时段中各单位时段内的搜索概率,确定所述搜索关键词在所述统计时段中的信息熵,并将所述信息熵作为所述搜索次数稳定度;
其中,所述搜索次数稳定度用于反应搜索次数在统计时段中各个单位时段内的变化情况。
2.如权利要求1所述的方法,其特征在于,所述根据所述搜索次数稳定度,在各搜索关键词中确定与所述统计时段对应的时效性词,具体为:
确定在所述统计时段中的搜索次数稳定度小于第一阈值的搜索关键词为与所述统计时段对应的时效性词;或者,
确定在统计时段中的搜索次数稳定度大于在相邻统计时段中的搜索次数稳定度,且在统计时段中的搜索次数稳定度与在所述相邻统计时段中的搜索次数稳定度的差值大于第二阈值,的搜索关键词为与该统计时段对应的时效性词。
3.如权利要求1所述的方法,其特征在于,所述根据所述搜索次数稳定度,在各搜索关键词中确定与所述统计时段对应的时效性词之后,还包括:将当前时刻所处的统计时段对应的时效性词展示给用户。
4.一种时效性词获取装置,其特征在于,包括:
获取模块,用于获取各搜索关键词在统计时段中的各单位时段内的搜索次数;
第一确定模块,用于根据搜索关键词在统计时段中的各单位时段内的搜索次数,确定所述搜索关键词在所述统计时段中的搜索次数稳定度;
第二确定模块,用于根据所述搜索次数稳定度,在各搜索关键词中确定与所述统计时段对应的时效性词;
其中,所述搜索关键词为服务器在当用户在网页输入搜索语句后获取所述用户输入的所述搜索语句,并对所述搜索语句进行分词处理得到的,所述服务器对应的记录用户搜索操作的时间;
所述第一确定模块,具体用于:
根据搜索关键词在统计时段中的各单位时段内的搜索次数和所述搜索关键词在统计时段中的总搜索次数,确定所述搜索关键词在所述统计时段中的各单位时段内的搜索概率;
根据所述搜索关键词在所述统计时段中各单位时段内的搜索概率,确定所述搜索关键词在所述统计时段中的信息熵,并将所述信息熵作为所述搜索次数稳定度;
其中,所述搜索次数稳定度用于反应搜索次数在统计时段中各个单位时段内的变化情况。
5.如权利要求4所述的装置,其特征在于,所述第二确定模块,具体用于:
确定在所述统计时段中的搜索次数稳定度小于第一阈值的搜索关键词为与所述统计时段对应的时效性词;或者,
确定在统计时段中的搜索次数稳定度大于在相邻统计时段中的搜索次数稳定度,且在统计时段中的搜索次数稳定度与在所述相邻统计时段中的搜索次数稳定度的差值大于第二阈值,的搜索关键词为与该统计时段对应的时效性词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110413881.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:关系型数据库的数据存储方法和存储系统
- 下一篇:地质信息的处理方法及装置