[发明专利]一种查询词推荐方法和查询词推荐系统有效
申请号: | 201210548573.9 | 申请日: | 2012-12-17 |
公开(公告)号: | CN103870505B | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 吴振元;王林青;汤佳宇;林锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 查询 推荐 方法 系统 | ||
技术领域
本发明涉及互联网搜索,特别是涉及一种查询词推荐方法和查询词推荐系统。
背景技术
在互联网搜索领域中,用户在搜索输入框中输入部分查询词字符时,为了节省用户的输入时间,网站会为用户推荐一些符合用户搜索意图并且以用户输入字符为前缀的查询词,而且按照相关性的高低把这些推荐的查询词进行排序,以供用户选择。
目前大多数网站的推荐系统是统计所有用户的历史搜索的查询词,根据这些查询词的搜索次数以及搜索之后有点击行为的次数来推荐以用户输入字符为前缀的相关查询词。
但是,这种推荐系统由于统计的是网站的历史搜索日志,因而无法准确提供符合搜索意图的推荐查询词。
而且,对于不同的用户,搜索意图一般是不同的,而现有的推荐系统针对不同用户输入的相同字符,推荐结果都是一样的,因此现有的推荐系统无法满足不同用户的搜索查询意图,尤其是对于只输入一个字符的情况,结果更糟糕。
发明内容
本申请提供了一种查询词推荐方法和查询词推荐系统,以提供更准确的推荐结果。
为了解决上述问题,本申请公开了一种查询词推荐方法,包括:
接收输入的字符,并确定输入所述字符的用户标识信息;
获取所述用户标识信息对应的偏好特征向量,所述偏好特征向量包括偏好查询词和偏好查询词对应的权重;并且,
获取以所述输入字符为前缀的查询词对应的候选查询词向量,所述候选查询词向量包括候选查询词和候选查询词对应的权重;
计算所述候选查询词向量与所述偏好特征向量的相似度;
根据所述相似度和所述候选查询词对应的权重对所述候选查询词进行排序得到推荐查询词。
可选地,所述获取所述用户标识信息对应的偏好特征向量包括:
获取所述用户标识信息对应的历史偏好特征向量,所述历史偏好特征向量包括历史偏好查询词和历史偏好查询词对应的权重;
获取所述用户标识信息对应的实时偏好特征向量,所述实时偏好特征向量包括实时偏好查询词和实时偏好查询词对应的权重;
将所述历史偏好特征向量和所述实时偏好特征向量组合为所述用户标识信息对应的偏好特征向量。
可选地,所述组合包括:
将所述历史偏好特征向量和所述实时偏好特征向量中的相同查询词合并为同一个偏好查询词,并将所述相同查询词的权重相加作为所述偏好查询词的权重;
将所述历史偏好特征向量和所述实时偏好特征向量中的不同查询词及其权重提取出来,作为所述偏好特征向量中的偏好查询词和偏好查询词对应的权重。
可选地,所述获取所述用户标识信息对应的历史偏好特征向量包括:
以所述用户标识信息为关键词查询历史偏好特征索引,并获取对应的预先生成的历史偏好特征向量,其中,所述历史偏好特征索引以用户标识信息作为关键词,并以历史偏好特征向量作为关键词对应的值;
所述历史偏好特征向量的生成包括:
获取所述用户标识信息对应的历史访问日志并进行统计,从中抽取出中心词及中心词对应的权重并组成中心词向量;
将中心词向量进行加权计算得到历史偏好特征向量。
可选地,所述获取所述用户标识信息对应的实时偏好特征向量包括:
以所述用户标识信息为关键词查询实时偏好特征索引,并获取对应的实时生成的实时偏好特征向量,其中,所述实时偏好特征索引以用户标识信息作为关键词,并以实时偏好特征向量作为关键词对应的值;
所述实时偏好特征向量的生成包括:
获取所述用户标识信息在当前同一session内的访问日志并进行统计,从中抽取出中心词及中心词对应的权重并组成中心词向量;
将所述用户实时搜索行为的时间序列衰减函数和实时搜索行为的时间作为权重因子,对所述中心词向量进行线性加权得到实时偏好特征向量。
可选地,所述用户标识信息为用户cookie,或登录账户,或用户cookie与登录账户的组合信息。
可选地,所述计算所述候选查询词向量与所述偏好特征向量的相似度包括:
将所述偏好特征向量和所述候选查询词向量相乘作为分子;
将所述偏好特征向量的模和所述候选查询词向量的模相乘作为分母;
将所述分子和分母做除运算,除运算的结果作为所述候选查询词向量与所述偏好特征向量的相似度。
可选地,所述根据相似度和所述候选查询词对应的权重对所述候选查询词进行排序得到推荐查询词包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210548573.9/2.html,转载请声明来源钻瓜专利网。