[发明专利]基于用户群组的推荐系统构建方法有效
申请号: | 201710125609.5 | 申请日: | 2017-03-04 |
公开(公告)号: | CN107122390B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 朱素平;张玮;唐志燕;杨弢;刘晓敏;袁媛;曹晓光 | 申请(专利权)人: | 华数传媒网络有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 推荐 系统 构建 方法 | ||
本发明公开了基于用户群组的推荐系统构建方法,具体包括如下步骤:101)数据划分步骤:对用户各类数据进行分类;102)组内分类步骤:在步骤101)后,对用户所属的类别集合中的每一个用户使用决策树进行进一步分类;103)推荐栏目步骤:根据步骤101)的类别和步骤102)的分类,使用基于用户的协同过滤方法,向用户推荐栏目;本发明提供了一种设计合理,推送精准的基于用户群组的推荐系统构建方法。
技术领域
本发明涉及互联网电视节目领域,更具体的说,它涉及用于基于用户群组的推荐系统构建方法。
背景技术
目前的推荐包括基于内容的推荐、协同过滤推荐(基于用户的协同过滤推荐和基于项目的协同过滤推荐)。基于内容的推荐可以很好的解决冷启动的问题并且兼顾内容本身的属性,向用户推荐其感兴趣的相似内容;协同过滤推荐利用集体智慧的方法向用户推荐产品。但由于用户具有社区性,具有明显地趋同性,目前在广电行业急需进行基于群组的推荐产品,来提高用户的体验。
发明内容
本发明克服了现有技术的不足,提供了一种处理效率高,具有社区性,明显地趋同性的基于用户群组的推荐系统构建方法,从而更符合现在用户的体验的需求。
本发明的技术方案如下:
基于用户群组的推荐系统构建方法,具体包括如下步骤:
101)数据划分步骤:对用户属性特征数据采用Kmeans方法进行聚类划分用户所属类别,得到用户所属的类别集合,根据用户的栏目点播详单、栏目表、评分表来划分出用户的栏目点播偏好集,根据用户的点播详单、评分表来划分出用户资产点播偏好集;所述Kmeans是通过不断地取离种子点最近均值的方法来获取数据的聚集;
102)组内分类步骤:在步骤101)后,对用户所属的类别集合中的每一个用户,结合用户的栏目点播偏好集,使用决策树对用户所属的类别进行进一步分类;
103)推荐栏目步骤:根据步骤101)对聚类划分用户所属类别和步骤102)分类后用户进一步的分组类别,使用基于用户的协同过滤方法,向用户推荐栏目,所述栏目会兼顾栏目和资产的归属关系,依据步骤102)中的用户的栏目点播偏好集对推荐的资产集进行组内重排。
进一步的,所述步骤101)中Kmeans方法具体包括如下步骤:
201)选取聚类质心点步骤:随机选择9个聚类质心点为{ctk1,ctk2,…,ctk9};
202)用户归类步骤:对每一个用户属性特征数据进行判定其应该属于的类,判定公式(a)如下:
其中:=符号是用后面的内容的式子来定义前面的标识,ct(i)代表样本与9个类中最近的那个类,ct(i)是9个类中的一个,ctkj为质心点,所述质心点是对属于同一个类的样本中心点的猜测;
203)重新确定质心点步骤:根据步骤202)对于每一个聚类质心进行重新计算具体公式(b):
其中j标识为所要计算的具体质心点,其中k表示用户数,即样本数;
重新计算后,回到步骤202),直到收敛,即质心不再发生变化而结束。
进一步的,所述步骤102)中决策树的具体步骤如下:
301)获取信息增益的步骤:通过如下公式(c)获得栏目点播偏好集中所有属性划分数据集D所得的信息增益;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华数传媒网络有限公司,未经华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710125609.5/2.html,转载请声明来源钻瓜专利网。