[发明专利]一种基于用户聚类的推荐方法有效
申请号: | 201410565721.7 | 申请日: | 2014-10-22 |
公开(公告)号: | CN104268290B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 李鹏;王娅丹;金瑜;刘璟;刘欣 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 严彦 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于用户聚类的推荐方法,为了合理的根据用户兴趣对用户进行有效推荐,根据用户对各主题标签的总浏览频率、浏览时间以及总浏览时间、有效浏览频率以及有效浏览时间,得到兴趣度,形成用户的兴趣特征向量;根据用户的兴趣特征向量,筛选核心用户,构成核心用户集,使用K‑means聚类算法对全体用户进行聚类;得到全用户聚类之后,计算出每个用户聚类在每个主题之上的类兴趣向量;比较兴趣值和类兴趣向量,对其进行推荐。本发明所提供的CCVR方法推荐效果要好于其它的推荐方法,具有良好的准确性。 | ||
搜索关键词: | 一种 基于 用户 推荐 方法 | ||
【主权项】:
一种基于用户聚类的推荐方法,其特征在于,包括以下步骤:Step1,输入用户集合U={u1,u2…uα}和主题标签集合C={s1,s2…sβ},α表示用户个数,β表示主题标签集合C中主题标签个数;初始化当前处理用户序号i取值为1,转到Step2;Step2,初始化当前处理标签序号j取值为1,转到Step3;Step3,如果用户ui关注了主题标签sj,转到Step4;否则令用户对第j个主题标签感兴趣的程度dj=0,转到Step9;Step4,根据用户ui对主题标签sj的浏览次数n,确定出用户ui对主题标签sj的总浏览频率f=n,转到Step5;Step5,确定用户ui对主题标签sj的第k次浏览时间tj,k以及总浏览时间T,k的取值为1,2,…n,转到Step6;Step6,确定用户ui对主题标签sj的有效浏览频率ef,转到Step7;确定方式为,若tmin≤tj,k≤tmax,tmin和tmax为用户ui对标签的最小浏览时间和最大浏览时间的预设阈值,则用户ui对第j个主题标签的第k次浏览是有效的,则用户ui对第j个主题标签的n次浏览过程中,所有有效浏览的次数之和为用户ui对第j个主题标签的有效浏览频率;Step7,求ef次有效浏览的浏览时间之和,计算出用户ui对主题标签sj的有效浏览时间et,转到Step8;Step8,根据下式,计算出用户ui对主题标签sj兴趣度dj,转到Step9;dj=(1-p)×fT/ps+2×p×efet/ps]]>其中,参数f1为用户对所有主题标签的浏览频率之和;ps为预设的系统参数兴趣时间系数,表示用户对第j个主题标签的平均浏览时间,表示用户对第j个主题标签的平均有效浏览时间;Step9,设用户ui在主题标签集合C中未浏览过的标签集合用cb表示,浏览过的标签集合用ca表示,根据下式,计算Vi,j,Vi,j表示用户ui对主题标签sj的兴趣度值,用户ui的兴趣向量为vi(Vi,1,Vi,2,…Vi,β);令j=j+1,如果j小于等于β则转到Step3,否则转到Step10;Vi,j=djj∈ca0j∈cb]]>Step10,令i=i+1,如果i小于等于α,转到Step2,否则令i=1,初始化核心用户数目γ取值为0,转到Step11;Step11,根据用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β)中非零元素所占比例得到兴趣密度值density(ui),如果兴趣密度值density(ui)>λ,标记ui为核心用户,转到Step12;否则转到Step13;其中,λ为预设的密度阈值;Step12,令γ=γ+1,转到Step13;Step13,令i=i+1,如果i小于等于α,转到Step11;否则转到Step14;Step14,当前得到γ个核心用户,开始用K‑means算法对全部用户进行聚类,本步骤以γ个核心用户为初始的聚类中心,初始定义变量newJ=0,oldJ=‑1,转到Step15;Step15,计算fabs(newJ‑oldJ),fabs函数表示计算绝对值,如果fabs(newJ‑oldJ)大于等于绝对值的相应预设阈值,转到Step16,否则转到Step19;Step16,对用户集合U={u1,u2…uα}中作为聚类中心的用户以外的各剩余用户,分别计算剩余用户与每个作为聚类中心的用户之间的欧式距离,并分配到距离最近的聚类中心相应聚类中,转到Step17;Step17,计算每个用户聚类Rh中所有用户兴趣向量的平均值,作为用户聚类Rh新的聚类中心Zh,转到Step18;Step18,令oldJ=newJ,根据准则函数计算新的准则函数值赋值给newJ,转到Step15;Step19,当前得到γ个用户聚类R1,R2…Rγ,转到Step20;Step20,初始化当前处理类别序号h取值为1,转到Step21;Step21,根据下式计算该类别的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ),转到Step22;其中,|Rh|表示用户聚类Rh中的用户个数,表示用户聚类Rh中的任一用户,用w表示聚类Rh中用户个数,取值为1,2......w,表示用户聚类Rh中用户对第j个主题标签的兴趣度,RVhj表示用户聚类Rh对第j个主题标签的兴趣度,j取值为1,2......β;Step22,令h=h+1,如果h小于等于γ,转到Step21,否则转到Step23;Step23,此时得到γ个类别的类兴趣向量,Rv1,Rv2…Rvγ,令h=1,转到Step24;Step24,为用户聚类Rh中的每个用户分别推荐主题标签,设用户聚类Rh中的用户为用户集合U={u1,u2…uα}中的用户ui,对于用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β),把它与用户聚类Rh的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ)中各兴趣值RVhj进行比较,如果Vi,j大于等于RVhj,则把主题标签sj推荐给用户,转到Step25;Step25,令h=h+1,如果h小于等于γ,转到Step24,否则转到Step26;Step26,对用户集合U={u1,u2…uα}中每个用户的自动推荐均已完成,结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410565721.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种栉梳机的梳理装置
- 下一篇:一种高效多晶铸锭炉热场结构