[发明专利]快速迭代的搜索引擎排序方法及系统在审
申请号: | 201611149705.5 | 申请日: | 2016-12-13 |
公开(公告)号: | CN106777088A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 张洪岩;黄永军;王金明 | 申请(专利权)人: | 飞狐信息技术(天津)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津创智天诚知识产权代理事务所(普通合伙)12214 | 代理人: | 周庆路,田阳 |
地址: | 300000 天津市滨海新区天津经济开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快速 搜索引擎 排序 方法 系统 | ||
1.一种快速迭代的搜索引擎排序方法,其特征在于,包括离线步骤和在线步骤,
所述的离线步骤包括,
训练出多个候选上线排序模型,
对各排序模型存储和比例分配,定时将排序模型及比例存入搜索服务器缓存数据库以备在线步骤读取;
所述的在线步骤包括,
接收用户请求并根据用户信息分配排序模型,
从索引中检索出相关文件,读取搜索服务器缓存数据库中的排序模型并计算排序然后返回给用户,
统计本次用户的搜索行为。
2.如权利要求1所述的搜索引擎排序方法,其特征在于,定时将排序模型及比例存入搜索服务器的key-value数据库。
3.如权利要求1所述的搜索引擎排序方法,其特征在于,所述的训练出多个候选上线排序模型包括以下子步骤,
收集用户点击记录,
根据用户点击记录还原用户搜索场景生成训练数据,
采用预定的不同算法和训练参数训练出多个候选上线排序模型。
4.如权利要求1所述的搜索引擎排序方法,其特征在于,所述的在线步骤根据用户的cookie为用户分配排序模型以保证同一个用户分配固定的排序模型。
5.如权利要求1所述的搜索引擎排序方法,其特征在于,所述的搜索行为包括用户查询词、用户点击的文件和该文件在输出文件列表中的位置。
6.一种快速迭代的搜索引擎排序系统,其特征在于,包括,
包括离线模块和在线模块,
所述的离线模块包括,
训练子模块,用以训练出多个候选上线排序模型,
模型管理子模块,用以对各排序模型存储和比例分配,并定时将排序模型及比例存入搜索服务器缓存数据库以备在线模块读取;
所述的在线步骤包括,
A/B测试子模块,用以接收用户请求并根据用户信息分配排序模型,
信息检索子模块,用以从索引中检索出相关文件,根据排序模型计算排序然后返回给用户,
统计子模块,用以统计本次用户的搜索行为。
7.如权利要求6所述的快速迭代的搜索引擎排序系统,其特征在于,定时将排序模型及比例存入搜索服务器的key-value数据库。
8.如权利要求6所述的快速迭代的搜索引擎排序系统,其特征在于,所述的训练子模块,
收集模块,用以收集用户点击记录,
信息处理模块;用以根据用户点击记录还原用户搜索场景并生成训练数据,
生成模块,用以采用预定的不同算法和训练参数训练出多个候选上线排序模型。
9.如权利要求6所述的快速迭代的搜索引擎排序系统,其特征在于,所述的在线步骤根据用户的cookie为用户分配排序模型以保证同一个用户分配固定的排序模型。
10.如权利要求6所述的搜索引擎排序方法,其特征在于,所述的搜索行为包括用户查询词、用户点击的文件和该文件在输出文件列表中的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞狐信息技术(天津)有限公司,未经飞狐信息技术(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611149705.5/1.html,转载请声明来源钻瓜专利网。