[发明专利]一种基于差分隐私保护的矩阵分解推荐方法在审

专利信息
申请号: 201810117975.0 申请日: 2018-02-06
公开(公告)号: CN108280217A 公开(公告)日: 2018-07-13
发明(设计)人: 侯君;李千目;刘魁;耿夏琛 申请(专利权)人: 南京理工大学
主分类号: G06F17/30 分类号: G06F17/30;G06F21/62;G06F17/16
代理公司: 南京理工大学专利中心 32203 代理人: 薛云燕
地址: 210094 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 隐私保护 预测模型 隐私 矩阵分解 因子矩阵 偏置 平均值计算 方法模型 模型参数 平方误差 评分矩阵 随机梯度 训练过程 准确度 训练集 最小化 预测 喜好 噪声 出差 转化
【权利要求书】:

1.一种基于差分隐私保护的矩阵分解推荐方法,其特征在于,包括以下步骤:

步骤1、将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;

步骤2、利用矩阵分解方法建立评分预测模型,利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;

步骤3、通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;

步骤4、根据评分预测模型,建立最小化平方误差函数;

步骤5、利用差分隐私随机梯度下降方法,训练评分预测模型中的用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项,并在训练过程中向用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项中添加差分隐私噪声,实现参数的差分隐私保护;

步骤6、利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。

2.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤1中所述的将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,具体如下:

将已收集的用于对物品的评价或喜好的,转化为n×m的用户-评分矩阵Rn×m,用户集U={u1,u2,...,un},其中n为用户总数,物品集I={i1,i2,...,im},其中m为物品总数,rui为用户u对物品i的评分。

3.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤2中所述的利用矩阵分解方法建立评分预测模型,具体如下:

步骤4中所述的根据评分预测模型,建立最小化平方误差函数,具体如下:

其中,rui表示用户u对物品i的评分,R表示评分矩阵,P表示用户因子矩阵,pu为用户因子矩阵中的向量,Q表示物品因子矩阵,qi表示物品因子矩阵中的向量;μ表示所有评分的平均数,用户偏置项bu表示用户u自身的打分倾向,物品偏置项bi表示物品i本身的所能得到的评价,而此时的则表示去掉偏置后用户的隐性因子u与物品的隐性因子i之间的关系;

λ(||bu||2+||bi||2+||pu||2+||qi||2)为防止过拟合的正则项,正则化参数λ控制了正则化程度。

4.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤3中所述的差分隐私平均值计算方法,具体如下:

(3.1)计算评分求和的敏感度:Δrsum=rmax-rmin,其中rmax表示评分中的最大值,rmin表示评分中的最小值;

(3.2)计算评分计数的敏感度:Δrcount=1;

(3.3)计算出差分隐私保护的评分和其中ε1为平均值计算的差分隐私预算,R表示评分矩阵,rui为评分矩阵中用户u对物品i的评分;

(3.4)计算出差分隐私保护的评分计数|R|+Lap(2Δrcount1);

(3.5)计算差分隐私保护的评分平均值:

5.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤5中所述的差分隐私随机梯度下降方法,具体如下:

(5.1)计算用户因子向量的敏感度sp=γ(emax·pmax+λ·qmax),其中sp表示用户因子向量敏感度,emax表示误差的最大值,pmax表示用户因子向量2范数的最大值,γ表示梯度下降速率,λ表示正则项,qmax表示物品因子向量2范数的最大值;

(5.2)计算物品因子向量的敏感度sq=γ(emax·qmax+λ·pmax),其中sq表示物品因子向量敏感度,emax表示误差的最大值,pmax表示用户因子向量2范数的最大值,γ表示梯度下降速率,λ表示正则项,qmax表示物品因子向量2范数的最大值;

(5.3)计算用户偏置项的敏感度sbu=γ(emax+λ·bumax),其中sbu表示用户偏置项敏感度,emax表示误差的最大值,γ表示梯度下降速率,λ表示正则项,bumax表示用户偏置项的最大值;

(5.4)计算物品偏置项的敏感度sbi=γ(emax+λ·bimax),其中sbi表示用户偏置项敏感度,emax表示误差的最大值,γ表示梯度下降速率,λ表示正则项,bimax表示物品偏置项的最大值;

(5.5)执行步骤(5.6)~(5.19)w次,其中w为随机梯度下降迭代次数;

(5.6)对用户-物品评分矩阵中的每个用户u以及每个物品i执行步骤(5.7)~(5.11);

(5.7)计算预测评分与实际评分的误差并令其中emax为误差截断参数;

(5.8)更新物品因子向量其中γ为随机梯度下降学习参数;

(5.9)更新用户因子向量

(5.10)更新用户偏置项

(5.11)更新物品偏置项

(5.12)对每个用户u,执行步骤(5.13)~(5.15);

(5.13)根据概率产生噪声向量np,其中ε2为差分隐私随机梯度下降的隐私预算;

(5.14)更新用户因子向量pu←pu+np;

(5.15)如果||pu||2>pmax,则执行其中pmax为用户因子向量规范化参数;

(5.16)对每个物品i,执行步骤(5.17)~(5.19);

(5.17)根据概率产生噪声向量np;

(5.18)更新物品因子向量qi←qi+np;

(5.19)如果||qi||2>qmax,则执行其中qmax为物品因子向量规范化参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810117975.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top