[发明专利]一种协同过滤推荐方法和系统有效
| 申请号: | 201810240236.0 | 申请日: | 2018-03-22 |
| 公开(公告)号: | CN108389113B | 公开(公告)日: | 2022-04-19 |
| 发明(设计)人: | 胡超;谭北海 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/17;G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
| 地址: | 510060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 协同 过滤 推荐 方法 系统 | ||
1.一种协同过滤推荐方法,其特征在于,包括:
S1:根据获取的所有预置项目和所述预置项目的用户评分数据,构建项目评分矩阵;
S2:根据所述项目评分矩阵计算单个用户对每两个所述预置项目的评分差,通过第一Sigmoid函数得到第一相似度,并计算所述单个用户对单个所述预置项目的评分与预置评分范围的评分中值之差,通过第二Sigmoid函数得到第二相似度,并计算所述单个用户对每两个所述预置项目的评分与单个用户对所有所述预置项目的评分平均值之差,通过第三Sigmoid函数得到第三相似度;
S3:根据所述第一相似度、所述第二相似度和所述第三相似度进行乘积计算,得到每两个所述预置项目的第一项目评分相似度;
S4:通过惩罚函数惩罚每两个所述预置项目的活跃用户,计算每两个所述预置项目的活跃用户个数占每两个所述预置项目的所有评分用户个数的比重,得到每两个所述预置项目的第二项目评分相似度;
S5:对所述第一项目评分相似度和所述第二项目评分相似度进行乘积计算,得到第三项目评分相似度;
S6:将所有所述预置项目的项目标签集转化为m维数值型标签向量,根据相似度度量算法计算两两所述预置项目的项目标签相似度;
S7:根据所述第三项目评分相似度与所述项目标签相似度占有的预置权重,计算项目标签协同过滤相似度;
所述第一相似度为:
其中,Proximity(Rui,Ruj)是项目i与项目j的所述第一相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,为第一Sigmoid函数;
所述第二相似度为:
其中,Significance(Rui,Ruj)是项目i与项目j的所述第二相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,Rmed为评分范围的中值,为第二Sigmoid函数;
所述第三相似度为:
其中,Singularity(Rui,Ruj)是项目i与项目j的所述第三相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,为用户u对所有项目评分的平均值,为第三Sigmoid函数;
所述第二项目评分相似度为:
其中,Nu(i,j)表示既评论过项目i又评论过项目j的用户数,N(i)和N(j)分别代表评论过项目i和项目j的用户数,Uij为项目i和项目j的所有用户数集。
2.根据权利要求1所述的协同过滤推荐方法,其特征在于,步骤S7之后还包括:
S8:根据所述项目标签协同过滤相似度通过K近邻算法计算所述预置项目的最近邻居集,根据所述最近邻居集计算用户对未进行评分的所述预置项目的预测评分,生成推荐列表。
3.一种协同过滤推荐系统,其特征在于,包括:
矩阵构建单元,用于根据获取的所有预置项目和所述预置项目的用户评分数据,构建项目评分矩阵;
评分计算单元,用于根据所述项目评分矩阵计算单个用户对每两个所述预置项目的评分差,通过第一Sigmoid函数得到第一相似度,并计算单个用户对单个所述预置项目的评分与预置评分范围的评分中值之差,通过第二Sigmoid函数得到第二相似度,并计算单个用户对每两个所述预置项目的评分与单个用户对所有所述预置项目的评分平均值之差,通过第三Sigmoid函数得到第三相似度;
第一计算单元,用于根据所述第一相似度、所述第二相似度和所述第三相似度进行乘积计算,得到每两个所述预置项目的第一项目评分相似度;
第二计算单元,用于通过惩罚函数惩罚所述每两个所述预置项目的活跃用户,计算每两个所述预置项目的活跃用户个数占所述每两个所述预置项目的所有评分用户个数的比重,得到每两个所述预置项目的第二项目评分相似度;
第三计算单元,用于对所述第一项目评分相似度和所述第二项目评分相似度进行乘积计算,得到第三项目评分相似度;
第四计算单元,用于将所有所述预置项目的项目标签集转化为m维数值型标签向量,根据相似度度量算法计算两两所述预置项目的项目标签相似度;
第五计算单元,用于根据所述第三项目评分相似度与所述项目标签相似度占有的预置权重,计算项目标签协同过滤相似度;
所述第一相似度为:
其中,Proximity(Rui,Ruj)是项目i与项目j的所述第一相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,为第一Sigmoid函数;
所述第二相似度为:
其中,Significance(Rui,Ruj)是项目i与项目j的所述第二相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,Rmed为评分范围的中值,为第二Sigmoid函数;
所述第三相似度为:
其中,Singularity(Rui,Ruj)是项目i与项目j的所述第三相似度,Rui为用户u对项目i的评分,Ruj为用户u对项目j的评分,为用户u对所有项目评分的平均值,为第三Sigmoid函数;
所述第二项目评分相似度为:
其中,Nu(i,j)表示既评论过项目i又评论过项目j的用户数,N(i)和N(j)分别代表评论过项目i和项目j的用户数,Uij为项目i和项目j的所有用户数集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810240236.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:3D房型模型显示方法
- 下一篇:一种基于大数据的虚拟服饰搭配系统





