[发明专利]一种基于用户访问行为的群体偏好上下文重构方法有效
| 申请号: | 201810114535.X | 申请日: | 2018-02-05 |
| 公开(公告)号: | CN108491417B | 公开(公告)日: | 2021-12-03 |
| 发明(设计)人: | 江昊;谢菁;黄国豪;羿舒文;曾园园 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/9535;H04L29/08 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430072*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 访问 行为 群体 偏好 上下文 方法 | ||
1.一种基于用户访问行为的群体偏好上下文重构方法,其特征在于,包括以下步骤:
步骤1:根据历史一周用户基站访问量数据构建用户基站访问量矩阵,根据用户基站访问量矩阵构建用户热点访问量矩阵,根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵,根据用户时隙访问量矩阵构建用户热时访问量矩阵,通过热点访问量矩阵计算用户热点中心信息增益,通过热时访问量矩阵计算用户热时中心信息增益,通过用户热点中心信息增益计算用户热点对访问基站的影响,通过用户热时中心信息增益计算用户热时对访问时隙的影响;
步骤2:根据URL类型划分用户兴趣的偏好,通过历史一周用户基站访问量数据得到热点的兴趣偏好以及热时的兴趣偏好,结合热点对访问基站的影响以及用户热时对访问时隙的影响构建用户中心点特征;
步骤3:通过用户中心点特征、内容向量以及用户中心点特征对内容向量的偏好程度计算关联矩阵;
步骤4:通过k-means聚类算法对用户效用向量进行分类,并根据偏好以及偏好类的对象构建中心点向量;
步骤5:通过新用户效用向量以及中心点向量计算新用户的欧式距离向量,通过新用户的欧式距离向量构建群体上下文偏好向量;
步骤5中所述新用户的欧式距离向量为:
其中,根据所述步骤4构建新用户r的效用向量为r∈[1,q],r为新用户的序号,q为新用户的数量,X为步骤4中所述中心点向量;
步骤6:新用户继续到来进一步更新群体上下文偏好向量并作为将来时刻的历史数据。
2.根据权利要求1所述的基于用户访问行为的群体偏好上下文重构方法,其特征在于,步骤1中所述根据历史一周用户基站访问量数据构建用户基站访问量矩阵为:
其中,Nus为用户数量,Nsta为总基站数量,为用户i在基站nsta一周访问量之和,i∈[1,Nus],nsta∈[1,Nsta];
步骤1中所述根据用户基站访问量矩阵构建用户热点访问量矩阵为将用户基站热点访问量矩阵S的行向量根据大小按降序排列,选择前m个基站作为用户i的热点,构建用户热点访问量矩阵:
其中,Nus为用户数量,m为热点数量,为用户i在基站一周访问量之和,i∈[1 Nus],nm∈[1 nbase];
步骤1中所述根据历史一周用户时隙访问量数据构建用户时隙访问量矩阵为:
其中,Nus为用户数量,将1天划分成的24个时隙,以小时为单位,Nti为一天划分时隙数量,为用户i在时隙nti一周访问量之和,nti∈[1,Nti];
步骤1中所述根据用户时隙访问量矩阵构建用户热时访问量矩阵为将用户基站热时访问量矩阵T的行向量根据大小按降序排列,选择前n个基站作为用户i的热时,构建用户热时访问量矩阵:
其中,Nus为用户数量,n为热时数量,为用户i在时隙一周访问量之和,i∈[1 Nus],nn∈[1 ntime];
步骤1中所述用户热点中心信息增益为:
其中,Nold为用户访问过的基站总数,Nold∈[1,Nsta],为用户i在热点nm的访问量,为用户i在所有访问基站的平均访问量,这里
步骤1中所述用户热时中心信息增益为:
其中,Nt为用户一周访问过的时隙总数,这里不同日期内的相同时隙计为同一时隙,Nt∈[1,Nti],为用户i在热时nn的访问量,为用户i在所有访问时隙的平均访问量,这里
步骤1中所述用户热点对访问基站的影响为:
其中,dist(nsta,nm)为基站nsta与用户i的热点nm之间的欧氏距离,
i∈[1,Nus],nsta∈[1,Nsta],nm∈[1,base];
步骤1中所述用户热时对访问时隙的影响为:
其中,inter(nti,nn)为时隙nti与用户i的热时nn之间的时间间隔,i∈[1,Nus],nti∈[1,Nti],nn∈[1,ntime];
步骤2中所述根据URL类型划分用户兴趣的偏好为h类,步骤2中所述热点的兴趣偏好为:
步骤2中所述热时的兴趣偏好为:
步骤2中所述用户中心点特征为:
其中,i为用户序号,i∈[1,Nus],至为步骤1中所述用户i热点对访问基站的影响,至为步骤1中所述用户i热时对访问时隙的影响;
步骤3中所述用户中心点特征对内容向量的偏好程度为:
sij=xiTWzj
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为关联矩阵,zj为步骤2中用户兴趣的偏好的子类内容向量,j为子类内容向量序号,j∈[1,Ne],可以从步骤1中所述基站获得,Ne表达基站子类内容的总数;
用户中心点特征xi对用户兴趣的偏好的子类内容向量zj的真实偏好为rij,rij与sij服从均值为0,方差为σ2的正态分布:
步骤3中所述计算关联矩阵为关联矩阵W的每个元素服从均值为0,方差为的正态分布,由贝叶斯公式可得后验概率为:
p(sij|rij)=p(rij|sij)*p(W)
通过求解最大后验概率的方法,可求解出关联矩阵W;
步骤4中所述用户效用向量为:
其中,xi为步骤2中所述用户中心点特征,i为用户序号,i∈[1,Nus],W为步骤3所述关联矩阵;
步骤4中所述k-means聚类算法对效用向量进行分类为Np个偏好类偏好类个数Np由轮廓系数α决定;
将偏好类o∈[1,Np]中所有对象的均值作为偏好类Co的中心点Xo:
步骤4中所述中心点向量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810114535.X/1.html,转载请声明来源钻瓜专利网。





