[发明专利]一种基于用户聚类的推荐方法有效

专利信息
申请号: 201410565721.7 申请日: 2014-10-22
公开(公告)号: CN104268290B 公开(公告)日: 2017-08-08
发明(设计)人: 李鹏;王娅丹;金瑜;刘璟;刘欣 申请(专利权)人: 武汉科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙)42222 代理人: 严彦
地址: 430081 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 用户 推荐 方法
【权利要求书】:

1.一种基于用户聚类的推荐方法,其特征在于,包括以下步骤:

Step1,输入用户集合U={u1,u2…uα}和主题标签集合C={s1,s2…sβ},α表示用户个数,β表示主题标签集合C中主题标签个数;初始化当前处理用户序号i取值为1,转到Step2;

Step2,初始化当前处理标签序号j取值为1,转到Step3;

Step3,如果用户ui关注了主题标签sj,转到Step4;否则令用户对第j个主题标签感兴趣的程度dj=0,转到Step9;

Step4,根据用户ui对主题标签sj的浏览次数n,确定出用户ui对主题标签sj的总浏览频率f=n,转到Step5;

Step5,确定用户ui对主题标签sj的第k次浏览时间tj,k以及总浏览时间T,k的取值为1,2,…n,转到Step6;

Step6,确定用户ui对主题标签sj的有效浏览频率ef,转到Step7;

确定方式为,若tmin≤tj,k≤tmax,tmin和tmax为用户ui对标签的最小浏览时间和最大浏览时间的预设阈值,则用户ui对第j个主题标签的第k次浏览是有效的,则用户ui对第j个主题标签的n次浏览过程中,所有有效浏览的次数之和为用户ui对第j个主题标签的有效浏览频率;

Step7,求ef次有效浏览的浏览时间之和,计算出用户ui对主题标签sj的有效浏览时间et,转到Step8;

Step8,根据下式,计算出用户ui对主题标签sj兴趣度dj,转到Step9;

其中,参数f1为用户对所有主题标签的浏览频率之和;ps为预设的系统参数兴趣时间系数,表示用户对第j个主题标签的平均浏览时间,表示用户对第j个主题标签的平均有效浏览时间;

Step9,设用户ui在主题标签集合C中未浏览过的标签集合用cb表示,浏览过的标签集合用ca表示,根据下式,计算Vi,j,Vi,j表示用户ui对主题标签sj的兴趣度值,用户ui的兴趣向量为vi(Vi,1,Vi,2,…Vi,β);令j=j+1,如果j小于等于β则转到Step3,否则转到Step10;

Step10,令i=i+1,如果i小于等于α,转到Step2,否则令i=1,初始化核心用户数目γ取值为0,转到Step11;

Step11,根据用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β)中非零元素所占比例得到兴趣密度值density(ui),如果兴趣密度值density(ui)>λ,标记ui为核心用户,转到Step12;否则转到Step13;其中,λ为预设的密度阈值;

Step12,令γ=γ+1,转到Step13;

Step13,令i=i+1,如果i小于等于α,转到Step11;否则转到Step14;

Step14,当前得到γ个核心用户,开始用K-means算法对全部用户进行聚类,本步骤以γ个核心用户为初始的聚类中心,初始定义变量newJ=0,oldJ=-1,转到Step15;

Step15,计算fabs(newJ-oldJ),fabs函数表示计算绝对值,如果fabs(newJ-oldJ)大于等于绝对值的相应预设阈值,转到Step16,否则转到Step19;

Step16,对用户集合U={u1,u2…uα}中作为聚类中心的用户以外的各剩余用户,分别计算剩余用户与每个作为聚类中心的用户之间的欧式距离,并分配到距离最近的聚类中心相应聚类中,转到Step17;

Step17,计算每个用户聚类Rh中所有用户兴趣向量的平均值,作为用户聚类Rh新的聚类中心Zh,转到Step18;

Step18,令oldJ=newJ,根据准则函数计算新的准则函数值赋值给newJ,转到Step15;

Step19,当前得到γ个用户聚类R1,R2…Rγ,转到Step20;

Step20,初始化当前处理类别序号h取值为1,转到Step21;

Step21,根据下式计算该类别的类兴趣向量Rvh=(RVh1,RVh2,...,RV),转到Step22;

其中,|Rh|表示用户聚类Rh中的用户个数,表示用户聚类Rh中的任一用户,用w表示聚类Rh中用户个数,取值为1,2......w,表示用户聚类Rh中用户对第j个主题标签的兴趣度,RVhj表示用户聚类Rh对第j个主题标签的兴趣度,j取值为1,2......β;

Step22,令h=h+1,如果h小于等于γ,转到Step21,否则转到Step23;

Step23,此时得到γ个类别的类兴趣向量,Rv1,Rv2…Rvγ,令h=1,转到Step24;

Step24,为用户聚类Rh中的每个用户分别推荐主题标签,设用户聚类Rh中的用户为用户集合U={u1,u2…uα}中的用户ui,对于用户ui的兴趣向量vi(Vi,1,Vi,2,…Vi,β),把它与用户聚类Rh的类兴趣向量Rvh=(RVh1,RVh2,...,RV)中各兴趣值RVhj进行比较,如果Vi,j大于等于RVhj,则把主题标签sj推荐给用户,转到Step25;

Step25,令h=h+1,如果h小于等于γ,转到Step24,否则转到Step26;

Step26,对用户集合U={u1,u2…uα}中每个用户的自动推荐均已完成,结束。

2.根据权利要求1所述基于用户聚类的推荐方法,其特征在于:Step18中,准则函数的计算公式如下,

其中,w代表用户聚类Rh中用户个数,表示两个特征向量之间的偏差的平方,为用户聚类Rh中的用户的兴趣向量,Zh为相应类别的聚类中心。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410565721.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top