[发明专利]一种基于用户群体偏好的科技资源动态协同过滤推荐方法在审
申请号: | 202010945150.5 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112182416A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 毛维娜;毛卫南;苗润莲 | 申请(专利权)人: | 北京市科学技术情报研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/955;G06F16/906 |
代理公司: | 北京华专卓海知识产权代理事务所(普通合伙) 11664 | 代理人: | 李巨智 |
地址: | 100048 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 群体 偏好 科技 资源 动态 协同 过滤 推荐 方法 | ||
1.一种基于用户群体偏好的科技资源动态协同过滤推荐方法,其特征在于,包括:
计算用户间的标签相似度以及计算用户对科技资源的评分相似度,根据所述用户间的标签相似度和用户对科技资源的评分相似度计算用户间的相似度;
将用户进行聚类,并构造科技资源的类别偏好矩阵;
根据所述科技资源的类别偏好矩阵,计算用户对目标科技资源与其他科技资源的类别偏好相似度,按照类别偏好相似度由从高到低对科技资源进行排列,生成目标科技资源的候选邻居列表;
计算所述目标科技资源的候选邻居列表中每个科技资源与其前若干个科技资源的评分相似度,生成科技资源最近邻列表;
将用户未评分的科技资源作为待预测科技资源,从所述科技资源最邻近列表中识别所述待预测科技资源所在行,并顺序提取前若干个已评分的科技资源,计算所述待预测科技资源的预测评分。
2.根据权利要求1所述的方法,其特征在于,所述计算用户间的标签相似度,包括:
其中,simtag(u,v)为第一用户u和第二用户v之间的标签相似度;第一用户的标签向量表示为u=(u1,u2,u3,...um);第二用户v的标签向量表示为v=(v1,v2,v3,...vm)。
3.根据权利要求1所述的方法,其特征在于,所述计算用户对科技资源的评分相似度,包括:
其中,wr是热门科技资源惩罚权值;Iuv表示同时被第一用户u和第二用户v调用过的科技资源,Ruj表示第一用户u对科技资源j的评分,Rvj表示第一用户u对科技资源j的评分,和表示第一用户u和第二用户v对所有不同科技资源的平均评分;si mrating(u,v)表示第一用户u和第二用户v对科技资源的评分相似度。
4.根据权利要求3所述的方法,其特征在于,所述热门科技资源惩罚权值为:
其中,wr为热门科技资源惩罚权值;r为两个用户共同评分过的科技资源;Nr为所有用户中喜欢该类科技资源r的用户数。
5.根据权利要求1所述的方法,其特征在于,所述用户间的相似度为:
simunify(u,v)=α×simrating(u,v)+(1-α)×simtag(u,v)
其中,simrating(u,v)为第一用户u和第二用户v对科技资源的评分相似度;simtag(u,v)为第一用户u和第二用户v之间的标签相似度;α为第一平衡因子,且0<α<1。
6.根据权利要求1所述的方法,其特征在于,所述将用户进行聚类,并构造科技资源的类别偏好矩阵,包括:
步骤1:在用户对任一科技资源的评分矩阵中,将所述科技资源的已评分用户进行聚类,得到若干个用户类;
步骤2:计算所述科技资源在各个用户类上的类别偏好值;
重复上述步骤1和步骤2,直至计算出全部科技资源在对应用户类上的类别偏好值,生成科技资源的类别偏好矩阵。
7.根据权利要求6所述的方法,其特征在于,所述类别偏好值为:
Pz,s=|Cs∩Uz|/|Uz|
其中,Pz,s为科技资源z在用户类Cs上的类别偏好值,Cs∈C,C为经过聚类生成的用户类集合;Uz={u∈U|Ru,z≠Φ}表示对科技资源z进行过评分的用户集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市科学技术情报研究所,未经北京市科学技术情报研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010945150.5/1.html,转载请声明来源钻瓜专利网。