[发明专利]基于随机森林修正的大数据下改进协同过滤推荐方法有效
申请号: | 201810808002.1 | 申请日: | 2018-07-22 |
公开(公告)号: | CN108920709B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 刘静;刘嘉豪 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于随机森林修正的大数据下改进协同过滤推荐方法,解决了在大数据下尚不能有效融入用户活跃度、热门物品、不同用户打分习惯导致的较低的推荐准确性和多样性的技术问题。过程包括:数据录入及参数设定;建立当前用户特征向量集合;构建随机森林分类模型;计算用户间相似度并寻找用户k个最近邻居;计算改进协同过滤法预测评分;得到初步推荐列表;用随机森林分类模型对初步推荐列表分类;结合两种方法进行修正得到当前用户最终推荐列表;对每个用户推荐,完成全体用户推荐。本发明将传统协同过滤法改进并结合随机森林分类进行修正,最终获得更为准确多样的推荐结果,用于网上购物商场等电子商务领域。 | ||
搜索关键词: | 基于 随机 森林 修正 数据 改进 协同 过滤 推荐 方法 | ||
【主权项】:
1.一种基于随机森林修正的大数据下改进协同过滤推荐方法,其特征在于,包括有如下步骤:步骤1数据录入及参数设定:根据电子商务网站的记录,提取用户对每个物品的评分,设定用户为ua,其中a为当前待推荐用户标记,协同过滤参数近邻数k,k为常数,取值区间为2‑20随机森林可调参数δ,δ为固定常数,提取用户评分信息,评分信息标记为ratings;步骤2建立当前用户特征向量集合:根据评分信息标记ratings,得到当前用户ua的特征向量集合Ti={(xi,yi)},i∈N+,特征向量
yi∈{0,1}是类标签;
是用户m对物品i的评分,i为用户ua评分过的物品标记,N+为物品总数量,m为用户总数量;步骤3构建随机森林分类模型:利用特征向量集合,为用户ua构造用户喜好随机森林分类模型,得到用户ua喜好随机森林分类模型;步骤4计算用户间相似度并寻找用户的k个最近邻居:对于用户ua∈U且a≠b,其中U为用户集合,b为非当前待推荐用户的任一用户标签,根据改进后的相似度公式计算用户间相似度sim(a,b),找到与用户ua相似度最高的k个最近邻居;步骤5计算改进协同过滤算法预测评分:利用用户间相似度及相似度最高的k个最近邻居,根据改进协同过滤预测评分公式计算用户ua对于所有未评分物品p的初步预测评分roq;步骤6得到初步推荐列表:找到所有预测评分中最高的Nitem个项目,Nitem为需要推荐商品的个数,通常取常数10,依照评分进行降序排序,构成对用户ua的推荐列表l;步骤7使用随机森林分类模型对初步推荐列表分类:使用随机森林分类模型对得到的推荐列表l中的物品进行分类;步骤8结合两种方法进行修正得到最终推荐列表:根据分类结果,结合改进协同过滤推荐得到的用户ua的初步推荐列表l,对评分进行对应的修正调整,对列表l中的物品按评分降序进行重排序,形成最终的推荐列表l′;步骤9进行最终推荐:取最终推荐列表l′中的前Nitem个,对用户ua进行推荐;步骤10判断是否结束:检测是否是最后一个用户,即a是否等于m;若不是,返回步骤2,对下一个用户进行推荐;若是,则完成全部用户的推荐,推荐结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810808002.1/,转载请声明来源钻瓜专利网。