[发明专利]IDF模型协同过滤模型的电影推荐方法、介质、设备及系统在审
| 申请号: | 202110528119.6 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN113139088A | 公开(公告)日: | 2021-07-20 |
| 发明(设计)人: | 李智杰;王启辉;伊志林;李昌华;张颉;介军 | 申请(专利权)人: | 西安建筑科技大学 |
| 主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/78 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 贺小停 |
| 地址: | 710055 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | idf 模型 协同 过滤 电影 推荐 方法 介质 设备 系统 | ||
1.IDF模型协同过滤模型的电影推荐方法,其特征在于,包括以下步骤:
采集电影推荐中影响因子的用户数据集,包括电影数据、评分数据和用户数据;
对用户数据集中相关影响因素数据通过作为深度置信网络DBN的输入,来进行数据预处理;
将预处理之后的数据输入到复合多粒度扫描IDF模型中并进行训练,训练完毕得到用户和电影的特征向量;
将得到的特征向量进行拼接,得到用户-电影评分矩阵,将得到的矩阵输入协同过滤模型,得到最终的电影推荐结果。
2.根据权利要求1所述的IDF模型协同过滤模型的电影推荐方法,其特征在于,电影数据包括电影ID、电影类型和电影名称;评分数据包括用户ID、电影ID、评分时间以及评分分值;用户数据包括性别、年龄、职业和数量。
3.根据权利要求1所述的IDF模型协同过滤模型的电影推荐方法,其特征在于,M表示男性,F表示女性,将标示性别的“F”和“M”转换为1和0;将年龄化为七个年龄分段,七个分段转换为0、1、2、3、4、5、6七个整数;电影类别字段使用一位有效编码,将类别字段转化为整数值,用二进制向量来表示整数值;电影名称与电影类别一样创建将文本转化为字符串之后再转化为数字的字典;将转化后的数据作为深度置信网络DBN的输入,来进行数据预处理。
4.根据权利要求3所述的IDF模型协同过滤模型的电影推荐方法,其特征在于,DBN的训练过程包含两个阶段:无监督的预训练和有监督的微调阶段;预训练阶段:采用RBM逐层进行预训练,直接将数据输入到最底层RBM的可见层进行训练,从该层输出的数据直接输入到DBN的输入层,作为下一层的输入;直至完成DBN的预训练;微调阶段:有监督的微调训练要前向传播算法得到输出数据和后向传播算法得到偏置值和权重值。
5.根据权利要求1所述的IDF模型协同过滤模型的电影推荐方法,其特征在于,使用复合多粒度扫描IDF数据进行特征提取,假设长度为n的一维特征向量,通过长度为m的滑动窗口进行扫描,并规定滑动窗口的滑动步距为1个单位长度,则结果包含(n-m+1)个具有m维特征向量的数据子集Fi;每次窗口滑动同时随机捕获相同维度的特征向量数据子集Fm,进而将两者合并构成(n-m+1)个具有2m维特征向量的数据子集Gi,如下公式所示:
Gi=Fi∪Fm,i∈(1,…,n-m+1)
对于一个n×n的二维数据采取相同的方式获取样本的特征向量数据子集,将两者复合得到了用户和电影特征向量数据子集。
6.根据权利要求1所述的IDF模型协同过滤模型的电影推荐方法,其特征在于,用得到的用户和电影特征向量来拟合用户—电影评分矩阵,计算用户、电影特征之间的相关度simuser-item:
首先,构建以喜好、浏览记录、评分、收藏为主的用户—电影评分矩阵,用户集合为包含N个用户的集合U={u1,u2,…,uN},电影集合为包含M个电影的集合I={i1,i2,…,i3}。每一位用户ui∈U都对至少一个电影进行了评价,评价结果以分值形式记录为RNM;所构成的用户-电影评分矩阵为:
上式中,行ri表示用户所评价电影集合,列rj表示评价这部电影的用户集合,rij为用户评分;
其次,根据用户-电影评分矩阵利用余弦相似度计算用户之间的相似度,余弦相似度就是将矩阵RNM中的第u、v行认定为向量a和b;用户u、v之间的相似度由向量a和b夹角的余弦值来定义;
然后,将用户与其他用户的最近邻居KNN通过用户之间的近似度得到,通过KNN设定的选择阈值选择前N个相似度最高的邻居。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安建筑科技大学,未经西安建筑科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110528119.6/1.html,转载请声明来源钻瓜专利网。





