[发明专利]一种基于用户聚类的推荐方法有效

申请号：	201410565721.7	申请日：	2014-10-22
公开（公告）号：	CN104268290B	公开（公告）日：	2017-08-08
发明（设计）人：	李鹏;王娅丹;金瑜;刘璟;刘欣	申请（专利权）人：	武汉科技大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙)42222	代理人：	严彦
地址：	430081 ***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于用户推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于用户聚类的推荐方法，其特征在于，包括以下步骤：

Step1，输入用户集合U＝{u₁,u₂…u_α}和主题标签集合C＝{s₁,s₂…s_β}，α表示用户个数，β表示主题标签集合C中主题标签个数；初始化当前处理用户序号i取值为1，转到Step2；

Step2，初始化当前处理标签序号j取值为1，转到Step3；

Step3，如果用户u_i关注了主题标签s_j，转到Step4；否则令用户对第j个主题标签感兴趣的程度d_j＝0，转到Step9；

Step4，根据用户u_i对主题标签s_j的浏览次数n，确定出用户u_i对主题标签s_j的总浏览频率f＝n，转到Step5；

Step5，确定用户u_i对主题标签s_j的第k次浏览时间t_j,k以及总浏览时间T，k的取值为1,2,…n，转到Step6；

Step6，确定用户u_i对主题标签s_j的有效浏览频率e_f，转到Step7；

确定方式为，若t_min≤t_j,k≤t_max，t_min和t_max为用户u_i对标签的最小浏览时间和最大浏览时间的预设阈值，则用户u_i对第j个主题标签的第k次浏览是有效的，则用户u_i对第j个主题标签的n次浏览过程中，所有有效浏览的次数之和为用户u_i对第j个主题标签的有效浏览频率；

Step7，求e_f次有效浏览的浏览时间之和，计算出用户u_i对主题标签s_j的有效浏览时间e_t，转到Step8；

Step8，根据下式，计算出用户u_i对主题标签s_j兴趣度d_j，转到Step9；

其中，参数f1为用户对所有主题标签的浏览频率之和；ps为预设的系统参数兴趣时间系数，表示用户对第j个主题标签的平均浏览时间，表示用户对第j个主题标签的平均有效浏览时间；

Step9，设用户u_i在主题标签集合C中未浏览过的标签集合用c_b表示，浏览过的标签集合用c_a表示，根据下式，计算V_i,j，V_i,j表示用户u_i对主题标签s_j的兴趣度值，用户u_i的兴趣向量为v_i(V_i,1,V_i,2,…V_i,β)；令j＝j+1，如果j小于等于β则转到Step3，否则转到Step10；

Step10，令i＝i+1，如果i小于等于α，转到Step2，否则令i＝1，初始化核心用户数目γ取值为0，转到Step11；

Step11，根据用户u_i的兴趣向量v_i(V_i,1,V_i,2,…V_i,β)中非零元素所占比例得到兴趣密度值density(u_i)，如果兴趣密度值density(u_i)＞λ，标记u_i为核心用户，转到Step12；否则转到Step13；其中，λ为预设的密度阈值；

Step12，令γ＝γ+1，转到Step13；

Step13，令i＝i+1，如果i小于等于α，转到Step11；否则转到Step14；

Step14，当前得到γ个核心用户，开始用K-means算法对全部用户进行聚类，本步骤以γ个核心用户为初始的聚类中心，初始定义变量newJ＝0，oldJ＝-1，转到Step15；

Step15，计算fabs(newJ-oldJ)，fabs函数表示计算绝对值，如果fabs(newJ-oldJ)大于等于绝对值的相应预设阈值，转到Step16，否则转到Step19；

Step16，对用户集合U＝{u₁,u₂…u_α}中作为聚类中心的用户以外的各剩余用户，分别计算剩余用户与每个作为聚类中心的用户之间的欧式距离，并分配到距离最近的聚类中心相应聚类中，转到Step17；

Step17，计算每个用户聚类R_h中所有用户兴趣向量的平均值，作为用户聚类R_h新的聚类中心Z_h，转到Step18；

Step18，令oldJ＝newJ，根据准则函数计算新的准则函数值赋值给newJ，转到Step15；

Step19，当前得到γ个用户聚类R₁,R₂…R_γ，转到Step20；

Step20，初始化当前处理类别序号h取值为1，转到Step21；

Step21，根据下式计算该类别的类兴趣向量Rv_h＝(RV_h1,RV_h2,...,RV_hβ)，转到Step22；

其中，|R_h|表示用户聚类R_h中的用户个数，表示用户聚类R_h中的任一用户，用w表示聚类R_h中用户个数，取值为1,2......w，表示用户聚类R_h中用户对第j个主题标签的兴趣度，RV_hj表示用户聚类R_h对第j个主题标签的兴趣度，j取值为1,2......β；

Step22，令h＝h+1，如果h小于等于γ，转到Step21，否则转到Step23；

Step23，此时得到γ个类别的类兴趣向量，Rv₁,Rv₂…Rv_γ，令h＝1，转到Step24；

Step24，为用户聚类R_h中的每个用户分别推荐主题标签，设用户聚类R_h中的用户为用户集合U＝{u₁,u₂…u_α}中的用户u_i，对于用户u_i的兴趣向量v_i(V_i,1,V_i,2,…V_i,β)，把它与用户聚类R_h的类兴趣向量Rv_h＝(RV_h1,RV_h2,...,RV_hβ)中各兴趣值RV_hj进行比较，如果V_i,j大于等于RV_hj，则把主题标签s_j推荐给用户，转到Step25；

Step25，令h＝h+1，如果h小于等于γ，转到Step24，否则转到Step26；

Step26，对用户集合U＝{u₁,u₂…u_α}中每个用户的自动推荐均已完成，结束。

2.根据权利要求1所述基于用户聚类的推荐方法，其特征在于：Step18中，准则函数的计算公式如下，

其中，w代表用户聚类R_h中用户个数，表示两个特征向量之间的偏差的平方，为用户聚类R_h中的用户的兴趣向量，Z_h为相应类别的聚类中心。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉科技大学，未经武汉科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410565721.7/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于用户聚类的推荐方法有效

专利文献下载