[发明专利]一种基于用户聚类的推荐方法有效
申请号: | 201410565721.7 | 申请日: | 2014-10-22 |
公开(公告)号: | CN104268290B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 李鹏;王娅丹;金瑜;刘璟;刘欣 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 严彦 |
地址: | 430081 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 推荐 方法 | ||
1.一种基于用户聚类的推荐方法,其特征在于,包括以下步骤:
Step1,输入用户集合U={u1,u2…uα}和主题标签集合C={s1,s2…sβ},α表示用户个数,β表示主题标签集合C中主题标签个数;初始化当前处理用户序号i取值为1,转到Step2;
Step2,初始化当前处理标签序号j取值为1,转到Step3;
Step3,如果用户ui关注了主题标签sj,转到Step4;否则令用户对第j个主题标签感兴趣的程度dj=0,转到Step9;
Step4,根据用户ui对主题标签sj的浏览次数n,确定出用户ui对主题标签sj的总浏览频率f=n,转到Step5;
Step5,确定用户ui对主题标签sj的第k次浏览时间tj,k以及总浏览时间T,k的取值为1,2,…n,转到Step6;
Step6,确定用户ui对主题标签sj的有效浏览频率ef,转到Step7;
确定方式为,若tmin≤tj,k≤tmax,tmin和tmax为用户ui对标签的最小浏览时间和最大浏览时间的预设阈值,则用户ui对第j个主题标签的第k次浏览是有效的,则用户ui对第j个主题标签的n次浏览过程中,所有有效浏览的次数之和为用户ui对第j个主题标签的有效浏览频率;
Step7,求ef次有效浏览的浏览时间之和,计算出用户ui对主题标签sj的有效浏览时间et,转到Step8;
Step8,根据下式,计算出用户ui对主题标签sj兴趣度dj,转到Step9;
其中,参数f1为用户对所有主题标签的浏览频率之和;ps为预设的系统参数兴趣时间系数,表示用户对第j个主题标签的平均浏览时间,表示用户对第j个主题标签的平均有效浏览时间;
Step9,设用户ui在主题标签集合C中未浏览过的标签集合用cb表示,浏览过的标签集合用ca表示,根据下式,计算Vi,j,Vi,j表示用户ui对主题标签sj的兴趣度值,用户ui的兴趣向量为vi(Vi,1,Vi,2,…Vi,β);令j=j+1,如果j小于等于β则转到Step3,否则转到Step10;
Step10,令i=i+1,如果i小于等于α,转到Step2,否则令i=1,初始化核心用户数目γ取值为0,转到Step11;
Step11,根据用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β)中非零元素所占比例得到兴趣密度值density(ui),如果兴趣密度值density(ui)>λ,标记ui为核心用户,转到Step12;否则转到Step13;其中,λ为预设的密度阈值;
Step12,令γ=γ+1,转到Step13;
Step13,令i=i+1,如果i小于等于α,转到Step11;否则转到Step14;
Step14,当前得到γ个核心用户,开始用K-means算法对全部用户进行聚类,本步骤以γ个核心用户为初始的聚类中心,初始定义变量newJ=0,oldJ=-1,转到Step15;
Step15,计算fabs(newJ-oldJ),fabs函数表示计算绝对值,如果fabs(newJ-oldJ)大于等于绝对值的相应预设阈值,转到Step16,否则转到Step19;
Step16,对用户集合U={u1,u2…uα}中作为聚类中心的用户以外的各剩余用户,分别计算剩余用户与每个作为聚类中心的用户之间的欧式距离,并分配到距离最近的聚类中心相应聚类中,转到Step17;
Step17,计算每个用户聚类Rh中所有用户兴趣向量的平均值,作为用户聚类Rh新的聚类中心Zh,转到Step18;
Step18,令oldJ=newJ,根据准则函数计算新的准则函数值赋值给newJ,转到Step15;
Step19,当前得到γ个用户聚类R1,R2…Rγ,转到Step20;
Step20,初始化当前处理类别序号h取值为1,转到Step21;
Step21,根据下式计算该类别的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ),转到Step22;
其中,|Rh|表示用户聚类Rh中的用户个数,表示用户聚类Rh中的任一用户,用w表示聚类Rh中用户个数,取值为1,2......w,表示用户聚类Rh中用户对第j个主题标签的兴趣度,RVhj表示用户聚类Rh对第j个主题标签的兴趣度,j取值为1,2......β;
Step22,令h=h+1,如果h小于等于γ,转到Step21,否则转到Step23;
Step23,此时得到γ个类别的类兴趣向量,Rv1,Rv2…Rvγ,令h=1,转到Step24;
Step24,为用户聚类Rh中的每个用户分别推荐主题标签,设用户聚类Rh中的用户为用户集合U={u1,u2…uα}中的用户ui,对于用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β),把它与用户聚类Rh的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ)中各兴趣值RVhj进行比较,如果Vi,j大于等于RVhj,则把主题标签sj推荐给用户,转到Step25;
Step25,令h=h+1,如果h小于等于γ,转到Step24,否则转到Step26;
Step26,对用户集合U={u1,u2…uα}中每个用户的自动推荐均已完成,结束。
2.根据权利要求1所述基于用户聚类的推荐方法,其特征在于:Step18中,准则函数的计算公式如下,
其中,w代表用户聚类Rh中用户个数,表示两个特征向量之间的偏差的平方,为用户聚类Rh中的用户的兴趣向量,Zh为相应类别的聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410565721.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种栉梳机的梳理装置
- 下一篇:一种高效多晶铸锭炉热场结构