[发明专利]网页打分模型的创建方法及装置有效
| 申请号: | 201410638360.4 | 申请日: | 2014-11-06 |
| 公开(公告)号: | CN104361077B | 公开(公告)日: | 2017-11-03 |
| 发明(设计)人: | 杨燕 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 路凯,胡彬 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网页 打分 模型 创建 方法 装置 | ||
1.一种网页打分模型的创建方法,其特征在于,包括:
获取网页训练样本集,其中所述网页训练样本集包括与预设的至少一个查询词中各个查询词下的多个样本网页的特征向量和标注打分;
根据所述网页训练样本集中各样本网页的标注打分以及预先确定的至少一个网页待调整特征,生成目标损失函数;
根据所生成的目标损失函数以及所述网页训练样本集中各样本网页的特征向量,创建网页打分模型。
2.根据权利要求1所述的网页打分模型的创建方法,其特征在于,根据所述网页训练样本集中各样本网页的标注打分以及预先确定的至少一个网页待调整特征,生成目标损失函数,包括:
获取根据所述网页训练样本集中各样本网页的标注打分得到的原始损失函数;
确定所述原始损失函数中的用于衡量所述网页训练样本集中相同查询词下不同网页之间差异程度的决策因子;
分别针对预先确定的至少一个网页待调整特征中各网页待调整特征,将用于表征该网页待调整特征的作用因子添加到所述决策因子中,以生成目标损失函数。
3.根据权利要求2所述的网页打分模型的创建方法,其特征在于,所述将用于表征该网页待调整特征的作用因子添加到所述决策因子中,包括:
将用于表征该网页待调整特征的作用因子乘以对应的作用系数后,添加到所述决策因子中;
其中,如果作用因子表征的网页待调整特征为网页待加强特征,则相应的作用系数为正系数;如果作用因子表征的网页待调整特征为网页待削弱特征,则相应的作用系数为负系数。
4.根据权利要求3所述的网页打分模型的创建方法,其特征在于,在根据所生成的目标损失函数以及所述网页训练样本集中各样本网页的特征向量,创建网页打分模型之后,还包括:
根据设定规则更新所述目标损失函数中的作用系数;
根据经过更新操作后的目标损失函数以及所述网页训练样本集中各样本网页的特征向量,创建新的网页打分模型。
5.根据权利要求3所述的网页打分模型的创建方法,其特征在于,所述决策因子H(xqi,xqj)=-h(xqi)+h(xqj);
经过添加操作后的所述决策因子
其中,q为大于等于1且小于等于Q的整数,Q为所述至少一个查询词中所有查询词个数;
h(xqi)和h(xqj)均是所述网页打分模型的预测值,xqi和xqj分别为所述至少一个查询词中第q个查询词下的不同网页;
t为大于等于1且小于等于至少一个网页待调整特征总个数的整数;
reduce_difft*label_diff用于表征所述至少一个网页待调整特征中第t个网页待调整特征的作用因子,εt为与用于表征所述至少一个网页待调整特征中第t个网页待调整特征的作用因子对应的作用系数;
reduce_difft=reducet,qi-reducet,qj,为xqi的第t个网页待调整特征值reducet,qi与xqj的第t个网页待调整特征值reducet,qj之间的差值;
label_diff=labelqi-labelqj是xqi的标注打分labelqi与xqj的标注打分labelqj之差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410638360.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种档案自动编研方法
- 下一篇:一种数据去重过程中的并行分块方法与系统





