[发明专利]一种获取网页和用户个性化特征的方法在审
申请号: | 201310103667.X | 申请日: | 2013-03-17 |
公开(公告)号: | CN104050203A | 公开(公告)日: | 2014-09-17 |
发明(设计)人: | 祁勇 | 申请(专利权)人: | 祁勇 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518053 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 网页 用户 个性化 特征 方法 | ||
1.一种获取网页和用户个性化特征的方法,其特征在于,所述方法包括在接入互联网的服务器中执行如下步骤:
S1.获取并存储由用户标识组成的用户集U,由网页标识组成的网页集D,由词序列标识组成的词序列集Q,以及由特征标识组成的特征集K;
S2.为所述网页集D中的多个网页设置参数向量初始值,以及为所述词序列集Q中的多个词序列设置参数向量初始值,参数向量初始值缺省为零向量;
S3.接收任意用户m(m∈U)提交的搜索查询,并在所述搜索查询中提取关键词,以及根据所述关键词合成词序列s(s∈Q);
S4.根据所述搜索查询,获取一组网页H,并将其发送给所述用户m;
S5.接收所述用户m点击所述一组网页H中的网页n的信号;
S6.读取所述网页n的参数向量(dwn1,dwn2,...,dwnk,...,dwnL),其中所述dwnk表示所述网页n与特征k(k∈K)的相关度;
S7.读取所述词序列s的参数向量(qws1,qws2,...,qwsk,...,qwsL),其中所述qwsk表示所述词序列s与特征k(k∈K)的相关度;
S8.应用如下特征传播算法,更新所述网页n和所述词序列s的参数向量:设更新后所述网页n的参数向量为(dwn1*,dwn2*,...,dwnk*,...,dwnL*),更新后所述词序列s的参数向量为(qws1*,qws2*,...,qwsk*,...,qwsL*),则所述算法包括:
dwnk*=f1[dwnk,qwsk,λ1(s,n,k)] (对于每个)
qwsk*=f2[qwsk,dwnk,λ2(n,s,k)] (对于每个)
返回所述步骤S3;
其中,函数f1和f2都是增函数,所述λ1(s,n,k)为在所述特征k下所述词序列s对所述网页n的影响系数,所述λ2(n,s,k)为在所述特征k下所述网页n对所述词序列s的影响系数,且dwnk*≥dwnk,qwsk*≥qwsk,所述QKs是由所述词序列s的参数向量(qws1,qws2,...,qwsk,...,qwsL)中数值最大的Qs个分量所对应的特征组成的集合,所述DKn是由所述网页n的参数向量(dwn1,dwn2...,dwnk,...,dwnL)中数值最大的Dn个分量所对应的特征组成的集合,且所述Qs和Dn为预设参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于祁勇,未经祁勇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310103667.X/1.html,转载请声明来源钻瓜专利网。