[发明专利]一种基于用户聚类的推荐方法有效

专利信息
申请号: 201410565721.7 申请日: 2014-10-22
公开(公告)号: CN104268290B 公开(公告)日: 2017-08-08
发明(设计)人: 李鹏;王娅丹;金瑜;刘璟;刘欣 申请(专利权)人: 武汉科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙)42222 代理人: 严彦
地址: 430081 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于用户聚类的推荐方法,为了合理的根据用户兴趣对用户进行有效推荐,根据用户对各主题标签的总浏览频率、浏览时间以及总浏览时间、有效浏览频率以及有效浏览时间,得到兴趣度,形成用户的兴趣特征向量;根据用户的兴趣特征向量,筛选核心用户,构成核心用户集,使用K‑means聚类算法对全体用户进行聚类;得到全用户聚类之后,计算出每个用户聚类在每个主题之上的类兴趣向量;比较兴趣值和类兴趣向量,对其进行推荐。本发明所提供的CCVR方法推荐效果要好于其它的推荐方法,具有良好的准确性。
搜索关键词: 一种 基于 用户 推荐 方法
【主权项】:
一种基于用户聚类的推荐方法,其特征在于,包括以下步骤:Step1,输入用户集合U={u1,u2…uα}和主题标签集合C={s1,s2…sβ},α表示用户个数,β表示主题标签集合C中主题标签个数;初始化当前处理用户序号i取值为1,转到Step2;Step2,初始化当前处理标签序号j取值为1,转到Step3;Step3,如果用户ui关注了主题标签sj,转到Step4;否则令用户对第j个主题标签感兴趣的程度dj=0,转到Step9;Step4,根据用户ui对主题标签sj的浏览次数n,确定出用户ui对主题标签sj的总浏览频率f=n,转到Step5;Step5,确定用户ui对主题标签sj的第k次浏览时间tj,k以及总浏览时间T,k的取值为1,2,…n,转到Step6;Step6,确定用户ui对主题标签sj的有效浏览频率ef,转到Step7;确定方式为,若tmin≤tj,k≤tmax,tmin和tmax为用户ui对标签的最小浏览时间和最大浏览时间的预设阈值,则用户ui对第j个主题标签的第k次浏览是有效的,则用户ui对第j个主题标签的n次浏览过程中,所有有效浏览的次数之和为用户ui对第j个主题标签的有效浏览频率;Step7,求ef次有效浏览的浏览时间之和,计算出用户ui对主题标签sj的有效浏览时间et,转到Step8;Step8,根据下式,计算出用户ui对主题标签sj兴趣度dj,转到Step9;dj=(1-p)×fT/ps+2×p×efet/ps]]>其中,参数f1为用户对所有主题标签的浏览频率之和;ps为预设的系统参数兴趣时间系数,表示用户对第j个主题标签的平均浏览时间,表示用户对第j个主题标签的平均有效浏览时间;Step9,设用户ui在主题标签集合C中未浏览过的标签集合用cb表示,浏览过的标签集合用ca表示,根据下式,计算Vi,j,Vi,j表示用户ui对主题标签sj的兴趣度值,用户ui的兴趣向量为vi(Vi,1,Vi,2,…Vi,β);令j=j+1,如果j小于等于β则转到Step3,否则转到Step10;Vi,j=djj∈ca0j∈cb]]>Step10,令i=i+1,如果i小于等于α,转到Step2,否则令i=1,初始化核心用户数目γ取值为0,转到Step11;Step11,根据用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β)中非零元素所占比例得到兴趣密度值density(ui),如果兴趣密度值density(ui)>λ,标记ui为核心用户,转到Step12;否则转到Step13;其中,λ为预设的密度阈值;Step12,令γ=γ+1,转到Step13;Step13,令i=i+1,如果i小于等于α,转到Step11;否则转到Step14;Step14,当前得到γ个核心用户,开始用K‑means算法对全部用户进行聚类,本步骤以γ个核心用户为初始的聚类中心,初始定义变量newJ=0,oldJ=‑1,转到Step15;Step15,计算fabs(newJ‑oldJ),fabs函数表示计算绝对值,如果fabs(newJ‑oldJ)大于等于绝对值的相应预设阈值,转到Step16,否则转到Step19;Step16,对用户集合U={u1,u2…uα}中作为聚类中心的用户以外的各剩余用户,分别计算剩余用户与每个作为聚类中心的用户之间的欧式距离,并分配到距离最近的聚类中心相应聚类中,转到Step17;Step17,计算每个用户聚类Rh中所有用户兴趣向量的平均值,作为用户聚类Rh新的聚类中心Zh,转到Step18;Step18,令oldJ=newJ,根据准则函数计算新的准则函数值赋值给newJ,转到Step15;Step19,当前得到γ个用户聚类R1,R2…Rγ,转到Step20;Step20,初始化当前处理类别序号h取值为1,转到Step21;Step21,根据下式计算该类别的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ),转到Step22;其中,|Rh|表示用户聚类Rh中的用户个数,表示用户聚类Rh中的任一用户,用w表示聚类Rh中用户个数,取值为1,2......w,表示用户聚类Rh中用户对第j个主题标签的兴趣度,RVhj表示用户聚类Rh对第j个主题标签的兴趣度,j取值为1,2......β;Step22,令h=h+1,如果h小于等于γ,转到Step21,否则转到Step23;Step23,此时得到γ个类别的类兴趣向量,Rv1,Rv2…Rvγ,令h=1,转到Step24;Step24,为用户聚类Rh中的每个用户分别推荐主题标签,设用户聚类Rh中的用户为用户集合U={u1,u2…uα}中的用户ui,对于用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β),把它与用户聚类Rh的类兴趣向量Rvh=(RVh1,RVh2,...,RVhβ)中各兴趣值RVhj进行比较,如果Vi,j大于等于RVhj,则把主题标签sj推荐给用户,转到Step25;Step25,令h=h+1,如果h小于等于γ,转到Step24,否则转到Step26;Step26,对用户集合U={u1,u2…uα}中每个用户的自动推荐均已完成,结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410565721.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top