[发明专利]一种基于用户分类的中毒样本构建方法在审
申请号: | 202211621347.9 | 申请日: | 2022-12-16 |
公开(公告)号: | CN115935188A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘柏嵩;王志业;张雪垣;林晨楠;胡测 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/241;G06F21/56 |
代理公司: | 宁波中致力专利代理事务所(普通合伙) 33322 | 代理人: | 张圆;黄挺 |
地址: | 315000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 分类 中毒 样本 构建 方法 | ||
1.一种基于用户分类的中毒样本构建方法,其特征在于:包括以下步骤:
步骤S1、对推荐系统中的用户进行分析,根据用户对目标物品的偏好和用户的历史交互记录数目将用户分类为脆弱用户和鲁棒用户;
步骤S2、对步骤S1分类好的两类的用户赋予相应的权重以表示用户的脆弱程度,根据得到的用户的脆弱程度定义动态权重,脆弱程度高的用户获得更高的权重;
步骤S3、基于步骤S2获得的动态权重构建一个代理模型,来模拟推荐系统中脆弱用户最大程度中毒后的状态,生成假用户的候选物品集合;
步骤S4、根据中毒后的推荐系统反馈结果选择假用户的交互项目,并生成评分,生成最终的假用户;
步骤S5、将步骤S4最终生成的假用户加入本地代理推荐系统的数据集,回到步骤S1,进行下一个假用户构建,直至向代理数据集内加入设定个数的假用户,完成推荐系统的投毒攻击。
2.根据权利要求1所述的一种基于用户分类的中毒样本构建方法,其特征在于:所述代理模型设立在本地,能完全还原目标推荐系统,代理模型使用的数据集与目标推荐系统的数据集完全一致。
3.根据权利要求2所述的一种基于用户分类的中毒样本构建方法,其特征在于:所述步骤S3具体包括以下子步骤:
子步骤S3.1、在推荐系统生成第j个假用户时,向代理模型的数据集中添加一条初始假用户vj的数据,初始假用户vj的历史交互记录中包括一条对于目标物品的最高评分以及多个种子物品,多个种子物品的评分分别符合各个物品整体评分的正态分布;
子步骤S3.2、根据推荐系统用户的脆弱性分类设计动态权重来定义代理模型的损失函数,以此利用训练好的代理模型来模拟脆弱用户最大程度中毒后的推荐系统状态;
子步骤S3.3、训练代理模型得到对假用户vj的推荐结果。
4.根据权利要求3所述的一种基于用户分类的中毒样本构建方法,其特征在于:所述步骤S4具体包括以下子步骤:
子步骤S4.1、根据训练好的代理模型得到假用户vj对每个物品的预测评分
子步骤S4.2、根据深度协同过滤算法的原理定义每个物品i的选择概率pi;
子步骤S4.3、生成每个物品的最终评分ratingi;
子步骤S4.4、根据最终评分从高到低选择top-r个物品作为假用户vj的填充物品,并根据推荐系统中所有物品评分的正态分布对假用户vj的填充物品进行评分,生成最终的假用户vj。
5.根据权利要求4所述的一种基于用户分类的中毒样本构建方法,其特征在于:步骤S1中对目标物品的预测评分高于设定阈值的定义为脆弱用户,反之则为鲁棒用户。
6.根据权利要求5所述的一种基于用户分类的中毒样本构建方法,其特征在于:步骤S2中,基于用户对目标物品偏好的权重定义为wu:
其中,为推荐系统中目标物品t的预测评分,对于预测评分小于设定阈值threshold的用户,将该类用户赋予权重wu=1;当预测评分达到或者超过设定阈值threshold时,将该类用户赋予权重wu=pow(a,y*η),a和η为超参数。
7.根据权利要求6所述的一种基于用户分类的中毒样本构建方法,其特征在于:步骤S2中,基于用户历史交互记录数目的权重定义为wuh=min_nuh/nuh,其中,min_nuh为所有用户中历史交互记录数目的最小值,nuh为某个用户u的历史交互记录数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211621347.9/1.html,转载请声明来源钻瓜专利网。