[发明专利]一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法在审

专利信息
申请号: 201910292355.5 申请日: 2019-04-12
公开(公告)号: CN110059220A 公开(公告)日: 2019-07-26
发明(设计)人: 张延华;王倩雯;付琼霄;张文博;李庆;陈冰容 申请(专利权)人: 北京工业大学
主分类号: G06F16/735 分类号: G06F16/735;G06F16/9535
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 刘萍
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 贝叶斯 准确度 辅助信息 概率矩阵 矩阵分解 评分矩阵 算法 电影 学习 分解 分解矩阵 推荐系统 项目特征 用户偏好 编码器 原有的 预测 堆栈 向量 稀疏 协同 概率 应用
【权利要求书】:

1.基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,包括以下步骤:

步骤1.从网上公开数据集获得用户,电影信息以及用户对电影的评分;

步骤2.利用word2vec预处理用户与电影信息,将其转变为向量;

步骤3.将用户向量输入用户侧栈式降噪自编码器,经过多次迭代,获取用户特征向量;将电影特征向量输入电影侧栈式降噪自编码器,经过多次迭代获取电影特征向量;

步骤4.将用户特征向量与电影特征向量作为贝叶斯概率分解矩阵的初始值;

步骤5.根据特征向量计算贝叶斯概率矩阵分解的参数,依照参数更新特征向量,多次重复,直至用户特征向量与电影特征向量内积与现有评分之间的误差低于0.4;

步骤6.根据预测评分进行电影推荐。

2.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤2具体为:利用word2vec预处理用户与电影信息,将其转变为向量;因电影标题由多个词汇构成,且有大写字母,所以先将所有大写字母转换为小写字母,将所有标题中的词汇组成词汇表,所有词由one-hot编码转化为词向量,然后对word2vec网络输入需要预测词的上下文向量进行该词预测,至少训练10次,保留网络参数,所有词乘以相应参数获得最终词向量;取该电影标题所有的词向量的平均值获得该电影标题向量,将电影标题向量和电影流派向量取平均值获得电影向量;将用户性别,职业也利用word2vec转化为相应的向量表达,取两个向量的平均值作为用户向量。

3.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤3具体为:

向原始用户向量加入噪声,生成第一个DAE输入向量,利用DAE的重构原理迭代训练50次,所有向量重构误差总和低于50,得到第一个隐藏层的各项参数和特征向量1,公式如下

h=fθ(x)=s(Wx+b);

h为第一个隐藏层的特征向量,x为加入噪声后的输入,W为输入层到隐藏层的权重,b为隐藏层神经元的偏置,s为sigmoid激活函数;第二步将上层的输出即提取出的特征向量作为第二层DAE的输入向量,通过同样方式训练约50次得到隐藏层2的输出,得到最后的输出,即用户特征向量;

将电影向量输入电影侧栈式降噪自编码器,向原始电影向量加入噪声,生成第一个DAE的输入向量,经过50次迭代训练,所有向量的误差总和低于50,获得第一个隐藏层的各项参数和特征向量;第二步将上层的输出即提取出的特征向量作为第二层DAE的输入向量,同样方式训练50次获得隐藏层的输出,即得到最终输出,电影特征向量。

4.根据权利要求1所述的基于深度学习和贝叶斯概率矩阵分解的电影推荐算法,其特征在于,步骤5具体为:

现有评分R与预测评分R*的差即R-R*服从均值为0,精度为α的高斯分布,α设置为0.1,用户与项目的特征向量先验分布为:

其中M为用户数目,N为电影数目,μU,μV为高斯分布均值,ΛU,ΛV为精度矩阵,{μU,ΛU},{μV,ΛV}被定义为超参数ΘU,ΘV,超参数服从高斯-威沙特分布共轭先验,如下式

Θ0为参数μ0,v0,W0的集合,为均值为μ0,精度矩阵为(β0ΛU)-1的高斯分布概率密度函数,μ0设置为0,β0设置为6,是自由度为v0,尺度矩阵为W0的威沙特分布,v0设置为10,W0设置为10×10的单位矩阵;

利用采用马尔科夫链-蒙特卡洛方法采样得预测评分的近似分布,即:

为用户ui对电影vj的预测评分,R为现有评分,T为总采样次数,为用户ui第t次采样的用户向量,为电影vj第t次采样的电影向量;

具体采样过程为:第一步根据起始特征矩阵U,V采样得全局超参数,第二步利用全局超参数重新采样得U,V,第三步重复第一,二步,直至最终预测评分与实际评分的误差低于0.4。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910292355.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top