[发明专利]基于用户群组的推荐系统构建方法有效

专利信息
申请号: 201710125609.5 申请日: 2017-03-04
公开(公告)号: CN107122390B 公开(公告)日: 2020-09-25
发明(设计)人: 朱素平;张玮;唐志燕;杨弢;刘晓敏;袁媛;曹晓光 申请(专利权)人: 华数传媒网络有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06K9/62
代理公司: 杭州天昊专利代理事务所(特殊普通合伙) 33283 代理人: 董世博
地址: 310051 浙江省杭州市滨*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 用户 推荐 系统 构建 方法
【权利要求书】:

1.基于用户群组的推荐系统构建方法,其特征在于,具体包括如下步骤:

101)数据划分步骤:对用户属性特征数据采用Kmeans方法进行聚类划分用户所属类别,得到用户所属的类别集合,根据用户的栏目点播详单、栏目表、评分表来划分出用户的栏目点播偏好集,根据用户的点播详单、评分表来划分出用户资产点播偏好集;所述Kmeans是通过不断地取离种子点最近均值的方法来获取数据的聚集;

102)组内分类步骤:在步骤101)后,对用户所属的类别集合中的每一个用户,结合用户的栏目点播偏好集,使用决策树对用户所属的类别进行进一步分类;

103)推荐栏目步骤:根据步骤101)对聚类划分用户所属类别和步骤102)分类后用户进一步的分组类别,使用基于用户的协同过滤方法,向用户推荐栏目,所述栏目会兼顾栏目和资产的归属关系,依据步骤102)中的用户的栏目点播偏好集对推荐的资产集进行组内重排;

所述步骤101)中Kmeans方法具体包括如下步骤:

201)选取聚类质心点步骤:随机选择9个聚类质心点为{ctk1,ctk2,…,ctk9};

202)用户归类步骤:对每一个用户属性特征数据进行判定其应该属于的类,判定公式(a)如下:

其中:=符号是用后面的内容的式子来定义前面的标识,ct(i)代表样本与9个类中最近的那个类,ct(i)是9个类中的一个,ctkj为质心点,所述质心点是对属于同一个类的样本中心点的猜测;

203)重新确定质心点步骤:根据步骤202)对于每一个聚类质心进行重新计算具体公式(b):

其中j标识为所要计算的具体质心点,其中k表示用户数,即样本数;

重新计算后,回到步骤202),直到收敛,即质心不再发生变化而结束;

所述步骤102)中决策树的具体步骤如下:

301)获取信息增益的步骤:通过如下公式(c)获得栏目点播偏好集中所有属性划分数据集D所得的信息增益;

其中A为某一属性,设置A有k个 不同的值,则使用属性A可将数据集D划分为{S1,S2,…,Sk};pi(i=1,2,…,m)表示第i个类别属性在样本中出现的频率;Gain(A)表示使用属性A进行划分前后的信息熵的变化,Entropy(D)表示按照类标签对训练数据集D进行划分得到的信息熵,EntropyA(D)表示按照属性A对D进行划分,得到的信息熵;

302)分裂信息和信息增益率步骤:根据步骤301)得到的数据,再使用如下公式计算各个属性的分裂信息公式(d)和信息增益率公式(e);

其中Split(A)表示分裂信息,是用来衡量属性A用来分裂数据的广度和均匀程度;GainRatio(A)表示信息增益率,Gain(A)表示使用属性A进行划分前后的信息熵的变化;

303)选择分裂节点步骤:根据步骤302)选择出信息增益率取值最大的属性作为分裂节点;

304)确定决策树步骤:反复递归调用步骤301)、步骤302)、步骤303),获得不同的分裂节点,最终获得决策树;

所述步骤103)的用户的协同过滤方法具体步骤如下:

401)获取相似度步骤:使用余弦相似度方法来获取用户的相似度,具体公式(f):

对于给定的用户u和v,N(u)表示用户u感兴趣的商品集合,N(v)表示用户v感兴趣的商品集合;

402)推荐产品步骤:根据如下公式(g)来获取用户最感兴趣的topN产品,并推送给用户:

其中p(u,i)表示用户u对物品i的感兴趣程度,S(u,K)表示和用户u兴趣最接近的K个用户,N(i)表示对物品i有过行为的用户集合,wuv表示用户u和用户v的兴趣相似度,rvi表示用户v对物品i的感兴趣程度;

所述组内重排,为优先推荐其所属栏目偏好的资产,然后再按照喜好程度进行降序排列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华数传媒网络有限公司,未经华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710125609.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top