[发明专利]一种基于分步动态填充缓解推荐系统数据稀疏性的方法有效
申请号: | 201810500434.6 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108830460B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 黄梅根;王渝;周理含 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/16 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分步 动态 填充 缓解 推荐 系统 数据 稀疏 方法 | ||
1.一种基于分步动态填充缓解推荐系统数据稀疏性的方法,其特征在于,包括以下步骤:
步骤1、对用户行为数据进行预处理,选取与美食商家及美食用户相关的信息,得到用户—美食商家评分矩阵;
步骤2、利用建立的用户—美食商家评分矩阵,为每个用户和每个美食商家构建历史评分记录集合,同时构建用户集合,按照用户的评分商家数从大到小对用户集合中的用户排序;
步骤3、设置用户相似度阈值α和用户历史共同评分差均值阈值β;
步骤4、按用户在用户集合中的顺序,选取一个目标用户;根据用户—美食商家评分矩阵,计算其余用户与目标用户的相似度;选取与目标用户相似度大于α的用户构建目标用户的预选相似邻居用户集;
步骤5、计算目标用户与各预选相似邻居用户的历史共同评分差均值,若两个用户历史本身没有共同评分商家,则他们的共同评分差均值为+∞;选取共同评分差均值小于β的预选邻居用户构造最终的相似邻居用户集;
步骤6、利用目标用户的相似邻居用户集对用户—美食商家评分矩阵进行第一步填充;
步骤7、对评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似商家,并利用相似商家集来对用户—美食商家评分矩阵进行第二步填充;
所述步骤6的利用相似邻居用户集N(u)对稀疏的用户—美食商家评分矩阵进行评分数据填充过程如下:
步骤6.1:利用相似邻居用户集对目标用户的未评分项进行填充;
步骤6.2:反复选取用户集合中下一个用户作为目标用户,对评分矩阵进行填充,即重复执行步骤4-步骤6,其中每次用于填充和计算用户相似度的用户—美食商家评分矩阵都是对上一个用户填充完成后的矩阵;直到取完用户集合中的所有用户为止,第一步填充完毕;
所述步骤7对评分矩阵中剩下的未填充数据,采用类似的方法,利用相似商家集来对用户—美食商家评分矩阵进行填充,填充过程如下:
步骤7.1:对于第一步填充后得到的用户—美食商家评分矩阵,构建商家集合I,统计每个商家被评分的次数,并按照商家被评分次数从大到小对商家集合排序;
步骤7.2:设置商家相似度阈值γ和商家历史共同评分差均值的阈值η;
步骤7.3:按商家在商家集合中的顺序,取一个目标商家,利用Pearson相关系数,计算其余商家与目标商家的相似度;将相似度大于γ的商家作为目标商家的预选邻居商家,构建预选邻居商家集p_N(i);
步骤7.4:计算预选邻居集中的商家与目标商家历史被相同用户评分的共同评分差均值,若两个商家历史没有被同一用户评分,则商家的共同评分差均值为+∞;将共同评分差均值小于η的商家作为目标商家的邻居商家,构建邻居商家集N(i);
步骤7.5:利用邻居商家集对评分矩阵中目标商家未评分数据进行填充,反复选取商家集合中的下一个商家,即重复执行步骤7.3-步骤7.5,其中每次用于相似度计算和填充的用户—美食商家评分矩阵都是对上一个商家填充完成后的矩阵;直到取到商家集合中的所有商家为止,用户—美食商家评分矩阵填充完毕。
2.根据权利要求1所述的基于分步动态填充缓解推荐系统数据稀疏性的方法,其特征在于,所述步骤1中的用户行为数据预处理过程如下:
步骤1.1:对从点评网站中获得用户行为数据,只选取美食商家及其用户的相关信息;
步骤1.2:建立用户—美食商家评分矩阵,(1)从总的数据中筛选出与美食商家及美食用户相关的信息;(2)用这些信息来建立用户—美食商家评分矩阵。
3.根据权利要求1所述的基于分步动态填充缓解推荐系统数据稀疏性的方法,其特征在于,所述步骤2具体过程如下:
步骤2.1:为每个用户构建用户的历史评分记录集合;为每个商家构建商家的历史评分记录集合;
步骤2.2:构建用户集合,统计每个用户的评分商家个数,按照用户评分商家个数从大到小对用户集合中的用户排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810500434.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理