[发明专利]一种基于协同训练的融合评分信息和物品内容的推荐方法有效
申请号: | 201811473802.9 | 申请日: | 2018-12-04 |
公开(公告)号: | CN109635291B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 张宜浩;刘智;朱常鹏;刘小洋;刘万平 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06Q30/02;G06Q30/0601 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 黄河 |
地址: | 400054 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 训练 融合 评分 信息 物品 内容 推荐 方法 | ||
1.一种基于协同训练的融合评分信息和物品内容的推荐方法,其特征在于,包括如下步骤:
S1、获取用户对物品的评论文本及用户对物品的评分,基于用户对物品的评分建立用户评分矩阵,初始化迭代次数为1,执行S2;
S2、基于用户对物品的评论文本建立用户情感倾向评分矩阵,执行S3;
S3、基于用户情感倾向评分矩阵更新用户评分矩阵,执行S4;
S4、基于用户评分矩阵生成数据训练集,执行S5;
S5、获取物品描述文本,基于物品描述文本生成物品描述向量,执行S6;
S6、基于物品描述向量及数据训练集更新用户评分矩阵,执行S7;S6包括如下步骤:
S601、基于训练数据集Dtrain中大于或等于预设正类分数阈值的用户评分对应的物品的物品描述向量、训练数据集Dtrain中小于或等于预设负类分数阈值的用户评分对应的物品的物品描述向量,建立第一用户物品描述向量集合;
S602、选取第一预设个数的用户评分等于预设评分的物品的用户物品描述向量建立候选用户物品描述向量集合,计算第一用户物品描述向量集合与候选用户物品描述向量集合中物品的距离和相似度;
S603、选取候选用户物品描述向量集合中每个物品的第二预设个数的近邻物品,计算候选用户物品描述向量集合中每个物品与其最近邻物品的平均距离;
S604、基于候选用户物品描述向量集合中每个物品与其最近邻物品的平均距离,更新候选用户物品描述向量集合中用户对物品的评分;
S605、基于更新后的候选用户物品描述向量集合用户对物品的评分更新物品的评分向量并更新第二数据集;
S606、利用基于置信度估计与聚类分析的数据选择算法对DL'进行数据分布分析并更新用户评分矩阵;
S7、将迭代次数加1,判断迭代次数是否大于或等于预设迭代次数,当迭代次数大于或等于预设迭代次数,执行S8,否则,执行S3;
S8、对用户评分矩阵中物品的评分进行排序并推荐;
在协同训练模型的每一次迭代训练过程中,利用用户对物品的评分信息训练评分预测模型,实现对评分矩阵的填充和更新;然后根据更新后的评分矩阵和物品的内容描述信息,训练得到基于物品内容的推荐模型,从而对评分矩阵进行填充和更新,将其作为基于物品的协同过滤推荐模型的输入,进行下一次迭代训练。
2.如权利要求1所述的基于协同训练的融合评分信息和物品内容的推荐方法,其特征在于,S2包括如下步骤:
S201、将所有评论文本进行切词,得到候选关键词;
S202、利用word2vec中的Skip-Gram模型训练候选关键词向量模型,得到每个候选关键词的K维向量表示;
S203、采用TF-IDF算法从候选关键词选出出现频率最高的Top-N个候选关键词作为关键词,并获取每个关键词的K维向量表示;
S204、将评论文本对应的关键词的K维向量表示输入长短期记忆人工神经网络,得到评论文本对应的用户情感倾向评分;
S205、基于用户情感倾向评分建立用户情感倾向评分矩阵。
3.如权利要求2所述的基于协同训练的融合评分信息和物品内容的推荐方法,其特征在于,S3包括如下步骤:
S301、基于公式更新用户评分,Ru(i)为第u个用户对第i个物品的用户评分,为第u个用户对第i个物品的用户情感倾向评分,α为权重平衡因子;
S302、基于更新后的用户评分建立用户评分矩阵Rm×n(U,I),行向量m表示用户的个数,列向量n表示物品的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811473802.9/1.html,转载请声明来源钻瓜专利网。