[发明专利]一种基于差分隐私保护的矩阵分解推荐方法在审
申请号: | 201810117975.0 | 申请日: | 2018-02-06 |
公开(公告)号: | CN108280217A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 侯君;李千目;刘魁;耿夏琛 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62;G06F17/16 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私保护 预测模型 隐私 矩阵分解 因子矩阵 偏置 平均值计算 方法模型 模型参数 平方误差 评分矩阵 随机梯度 训练过程 准确度 训练集 最小化 预测 喜好 噪声 出差 转化 | ||
本发明公开了一种基于差分隐私保护的矩阵分解推荐方法。该方法如下:将已收集的用户对物品的评价或喜好,转化为用户‑评分矩阵,作为推荐方法模型的训练集;利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;根据评分预测模型,建立最小化平方误差函数;利用差分隐私随机梯度下降方法,训练评分预测模型并在训练过程中添加差分隐私噪声,实现参数的差分隐私保护;利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。本发明可以在提供推荐结果时,对用户的信息进行差分隐私保护,并具有较高的推荐准确度。
技术领域
本发明涉及数据分析与数据挖掘技术领域,特别是一种基于差分隐私保护的矩阵分解推荐方法。
背景技术
当今社会,随着互联网和移动互联网的快速普及与发展,各类网络应用与移动App已经融入到人们日常工作生活的方方面面,例如即时通讯、社交网络、电子商务与电子支付等等,人们的日常工作与生活已经离不开互联网与移动互联网。网民数量与网站应用数量的飞速增长的同时,互联网上的各类信息也在加速增长中,在巨大的网民与网站基数下,每时每刻增加的信息数量已经超过一般人的承受能力。这使得在海量的互联网数据中,人们无法主动有效的找到、处理和利用自己想要的数据,这种情况被称作信息过载(Information Overload)问题。
在信息过载的时代,人们也在寻找解决信息处理与利用的有效方案。推荐系统不仅帮助人们更有效地获得想要的信息,也帮助信息提供者更好的将自己的信息推送到目标人群中,推荐系统已经成为当今互联网的重要环节。推荐系统的工作就是分析用户的喜好与使用习惯,建立用户与信息或产品之间的关系模型,再利用推荐方法完成相应的推荐。推荐系统在为用户建立定制化服务时,最基本的方法是通过用户自己设置自己想要的信息或产品的类型来获得推荐。推荐系统为了提供更准确的服务,使自己的推荐更符合用户的需求,需要收集大量的用户行为、使用习惯等信息来进行推荐,例如用户的浏览记录、购买信息、评分数据等信息。而且往往用户行为数据越丰富、越详细,构建的推荐模型就越准确。但是,在这大量的用户行为、使用习惯等信息中存在泄露用户个人隐私的风险。对于推荐系统来说,尽最大可能地保护用户的隐私安全与提升推荐系统的推荐准确度同等重要。因为更安全的隐私保护会减少用户分享自己隐私信息的担忧,使用户会更愿意提供自己的真实使用数据给推荐系统。而更丰富和准确的数据则会进一步提高推荐的准确度,提供更好的用户体验,从而进一步提高用户对推荐系统的信心与参与度,促成一个良性的循环。因此推荐系统的隐私保护研究,对于推动推荐系统良性发展,是具有非常重要的意义的。
Dwork 2006年提出了差分隐私机制。它首先定义了一个极为严格的攻击模型,通过对数据集中的原始信息或者统计数据添加噪声来实现对隐私的保护。因此即使攻击者拥有除目标隐私信息外的所有背景知识,隐私数据依然可以得到有效的保护。这些差分隐私的优点使得它受到国内外研究者的广泛研究。由于差分隐私保护在实际的使用过程中,大多是通过在数据集或者方法的输出结果中添加噪声来实现,如果不恰当的使用,则会造成数据集中添加噪声过大、数据可用性降低的问题。
发明内容
本发明的目的在于提供一种基于差分隐私保护的矩阵分解推荐方法,可以在提供推荐结果时,对用户的信息进行差分隐私保护,并能够保证较好的推荐准确度。
实现本发明目的的技术解决方案是:一种基于差分隐私保护的矩阵分解推荐方法,包括以下步骤:
步骤1、将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;
步骤2、利用矩阵分解方法建立评分预测模型,利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;
步骤3、通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;
步骤4、根据评分预测模型,建立最小化平方误差函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810117975.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种页面性能优化方法和装置
- 下一篇:一种基于检索和生产混合问答的流程系统