[发明专利]一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法在审
申请号: | 201910292355.5 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110059220A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 张延华;王倩雯;付琼霄;张文博;李庆;陈冰容 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/9535 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 贝叶斯 准确度 辅助信息 概率矩阵 矩阵分解 评分矩阵 算法 电影 学习 分解 分解矩阵 推荐系统 项目特征 用户偏好 编码器 原有的 预测 堆栈 向量 稀疏 协同 概率 应用 | ||
1.基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,包括以下步骤:
步骤1.从网上公开数据集获得用户,电影信息以及用户对电影的评分;
步骤2.利用word2vec预处理用户与电影信息,将其转变为向量;
步骤3.将用户向量输入用户侧栈式降噪自编码器,经过多次迭代,获取用户特征向量;将电影特征向量输入电影侧栈式降噪自编码器,经过多次迭代获取电影特征向量;
步骤4.将用户特征向量与电影特征向量作为贝叶斯概率分解矩阵的初始值;
步骤5.根据特征向量计算贝叶斯概率矩阵分解的参数,依照参数更新特征向量,多次重复,直至用户特征向量与电影特征向量内积与现有评分之间的误差低于0.4;
步骤6.根据预测评分进行电影推荐。
2.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤2具体为:利用word2vec预处理用户与电影信息,将其转变为向量;因电影标题由多个词汇构成,且有大写字母,所以先将所有大写字母转换为小写字母,将所有标题中的词汇组成词汇表,所有词由one-hot编码转化为词向量,然后对word2vec网络输入需要预测词的上下文向量进行该词预测,至少训练10次,保留网络参数,所有词乘以相应参数获得最终词向量;取该电影标题所有的词向量的平均值获得该电影标题向量,将电影标题向量和电影流派向量取平均值获得电影向量;将用户性别,职业也利用word2vec转化为相应的向量表达,取两个向量的平均值作为用户向量。
3.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤3具体为:
向原始用户向量加入噪声,生成第一个DAE输入向量,利用DAE的重构原理迭代训练50次,所有向量重构误差总和低于50,得到第一个隐藏层的各项参数和特征向量1,公式如下
h=fθ(x)=s(Wx+b);
h为第一个隐藏层的特征向量,x为加入噪声后的输入,W为输入层到隐藏层的权重,b为隐藏层神经元的偏置,s为sigmoid激活函数;第二步将上层的输出即提取出的特征向量作为第二层DAE的输入向量,通过同样方式训练约50次得到隐藏层2的输出,得到最后的输出,即用户特征向量;
将电影向量输入电影侧栈式降噪自编码器,向原始电影向量加入噪声,生成第一个DAE的输入向量,经过50次迭代训练,所有向量的误差总和低于50,获得第一个隐藏层的各项参数和特征向量;第二步将上层的输出即提取出的特征向量作为第二层DAE的输入向量,同样方式训练50次获得隐藏层的输出,即得到最终输出,电影特征向量。
4.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤5具体为:
现有评分R与预测评分R*的差即R-R*服从均值为0,精度为α的高斯分布,α设置为0.1,用户与项目的特征向量先验分布为:
其中M为用户数目,N为电影数目,μU,μV为高斯分布均值,ΛU,ΛV为精度矩阵,{μU,ΛU},{μV,ΛV}被定义为超参数ΘU,ΘV,超参数服从高斯-威沙特分布共轭先验,如下式
Θ0为参数μ0,v0,W0的集合,为均值为μ0,精度矩阵为(β0ΛU)-1的高斯分布概率密度函数,μ0设置为0,β0设置为6,是自由度为v0,尺度矩阵为W0的威沙特分布,v0设置为10,W0设置为10×10的单位矩阵;
利用采用马尔科夫链-蒙特卡洛方法采样得预测评分的近似分布,即:
为用户ui对电影vj的预测评分,R为现有评分,T为总采样次数,为用户ui第t次采样的用户向量,为电影vj第t次采样的电影向量;
具体采样过程为:第一步根据起始特征矩阵U,V采样得全局超参数,第二步利用全局超参数重新采样得U,V,第三步重复第一,二步,直至最终预测评分与实际评分的误差低于0.4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910292355.5/1.html,转载请声明来源钻瓜专利网。