[发明专利]基于用户群组的推荐系统构建方法有效
申请号: | 201710125609.5 | 申请日: | 2017-03-04 |
公开(公告)号: | CN107122390B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 朱素平;张玮;唐志燕;杨弢;刘晓敏;袁媛;曹晓光 | 申请(专利权)人: | 华数传媒网络有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 推荐 系统 构建 方法 | ||
1.基于用户群组的推荐系统构建方法,其特征在于,具体包括如下步骤:
101)数据划分步骤:对用户属性特征数据采用Kmeans方法进行聚类划分用户所属类别,得到用户所属的类别集合,根据用户的栏目点播详单、栏目表、评分表来划分出用户的栏目点播偏好集,根据用户的点播详单、评分表来划分出用户资产点播偏好集;所述Kmeans是通过不断地取离种子点最近均值的方法来获取数据的聚集;
102)组内分类步骤:在步骤101)后,对用户所属的类别集合中的每一个用户,结合用户的栏目点播偏好集,使用决策树对用户所属的类别进行进一步分类;
103)推荐栏目步骤:根据步骤101)对聚类划分用户所属类别和步骤102)分类后用户进一步的分组类别,使用基于用户的协同过滤方法,向用户推荐栏目,所述栏目会兼顾栏目和资产的归属关系,依据步骤102)中的用户的栏目点播偏好集对推荐的资产集进行组内重排;
所述步骤101)中Kmeans方法具体包括如下步骤:
201)选取聚类质心点步骤:随机选择9个聚类质心点为{ctk1,ctk2,…,ctk9};
202)用户归类步骤:对每一个用户属性特征数据进行判定其应该属于的类,判定公式(a)如下:
其中:=符号是用后面的内容的式子来定义前面的标识,ct(i)代表样本与9个类中最近的那个类,ct(i)是9个类中的一个,ctkj为质心点,所述质心点是对属于同一个类的样本中心点的猜测;
203)重新确定质心点步骤:根据步骤202)对于每一个聚类质心进行重新计算具体公式(b):
其中j标识为所要计算的具体质心点,其中k表示用户数,即样本数;
重新计算后,回到步骤202),直到收敛,即质心不再发生变化而结束;
所述步骤102)中决策树的具体步骤如下:
301)获取信息增益的步骤:通过如下公式(c)获得栏目点播偏好集中所有属性划分数据集D所得的信息增益;
其中A为某一属性,设置A有k个 不同的值,则使用属性A可将数据集D划分为{S1,S2,…,Sk};pi(i=1,2,…,m)表示第i个类别属性在样本中出现的频率;Gain(A)表示使用属性A进行划分前后的信息熵的变化,Entropy(D)表示按照类标签对训练数据集D进行划分得到的信息熵,EntropyA(D)表示按照属性A对D进行划分,得到的信息熵;
302)分裂信息和信息增益率步骤:根据步骤301)得到的数据,再使用如下公式计算各个属性的分裂信息公式(d)和信息增益率公式(e);
其中Split(A)表示分裂信息,是用来衡量属性A用来分裂数据的广度和均匀程度;GainRatio(A)表示信息增益率,Gain(A)表示使用属性A进行划分前后的信息熵的变化;
303)选择分裂节点步骤:根据步骤302)选择出信息增益率取值最大的属性作为分裂节点;
304)确定决策树步骤:反复递归调用步骤301)、步骤302)、步骤303),获得不同的分裂节点,最终获得决策树;
所述步骤103)的用户的协同过滤方法具体步骤如下:
401)获取相似度步骤:使用余弦相似度方法来获取用户的相似度,具体公式(f):
对于给定的用户u和v,N(u)表示用户u感兴趣的商品集合,N(v)表示用户v感兴趣的商品集合;
402)推荐产品步骤:根据如下公式(g)来获取用户最感兴趣的topN产品,并推送给用户:
其中p(u,i)表示用户u对物品i的感兴趣程度,S(u,K)表示和用户u兴趣最接近的K个用户,N(i)表示对物品i有过行为的用户集合,wuv表示用户u和用户v的兴趣相似度,rvi表示用户v对物品i的感兴趣程度;
所述组内重排,为优先推荐其所属栏目偏好的资产,然后再按照喜好程度进行降序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华数传媒网络有限公司,未经华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710125609.5/1.html,转载请声明来源钻瓜专利网。