[发明专利]一种基于用户分类的中毒样本构建方法在审
申请号: | 202211621347.9 | 申请日: | 2022-12-16 |
公开(公告)号: | CN115935188A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘柏嵩;王志业;张雪垣;林晨楠;胡测 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/241;G06F21/56 |
代理公司: | 宁波中致力专利代理事务所(普通合伙) 33322 | 代理人: | 张圆;黄挺 |
地址: | 315000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 分类 中毒 样本 构建 方法 | ||
本发明公开了一种基于用户分类的中毒样本构建方法,包括以下步骤:定义系统中的脆弱用户和鲁棒用户;定义损失函数即每个用户的动态权重,构建代理模型,模拟系统脆弱用户尽可能中毒的状态来得到假用户候选交互物品候选集合,并通过初始化假用户来降低推荐偏差以提高候选交互物品的可信性;定义每个物品的选择概率,得到所有物品的最终评分,按评分从高到低选取假用户的交互物品。本发明增强了基于深度学习推荐系统的数据中毒攻击的攻击性,同时降低了攻击成本,并为推荐系统对于数据中毒攻击的防御提供了思路。
技术领域
本发明涉及计算机技术领域,特别是一种基于用户分类的中毒样本构建方法。
背景技术
随着大数据时代的来临,信息处理的方式发生了巨大的变化。推荐系统作为一种有效的信息过滤方式,有效缓解了信息爆炸的问题。推荐系统在电商、音乐等领域给用户带来了极大的便利,尤其是深度学习技术的发展以及在推荐系统领域的应用,使得深度学习技术成为推荐系统领域的一个趋势。但是推荐系统仍然面临着一些不可避免的隐私以及安全问题,包括推荐系统过度搜集用户隐私,利用成员推理攻击推理出了推荐系统的原始训练集,推荐系统的水军攻击(数据中毒攻击)等等,对推荐系统的隐私安全问题提出了新的挑战。然而随着电商等领域水军,刷好评等现象的频繁出现,尤其在推荐系统领域中,刷好评会大大降低用户对系统的信任,因此对于推荐系统的水军攻击与防御的研究意义重大。
现有的基于深度学习推荐系统的数据中毒攻击进行物品推广的攻击技术的研究中,都是对系统中的所有用户进行物品推广,推广攻击的本质是通过学习系统中的用户的特征来构建假用户,以此来推广目标物品,但是由于系统中不同的用户的特征不同,因此对于以往所有的推广攻击并未对系统用户进行分类攻击,得到的推广效果也不是非常理想。因此,基于用户分类的数据中毒攻击的研究在当下具有重要的意义,只有清楚地了解数据中毒攻击的具体攻击手段才可以更好地进行防御,为推荐系统对于数据中毒攻击的防御提供新的思路。
发明内容
本发明的目的在于,提供一种基于用户分类的中毒样本构建方法。本发明增强了基于深度学习推荐系统的数据中毒攻击的攻击性,同时降低了攻击成本,并为推荐系统对于数据中毒攻击的防御提供了思路。
本发明的技术方案:一种基于用户分类的中毒样本构建方法,本发明中的攻击者基于白盒先验知识,由于白盒先验知识对于攻击者来说是最严苛的条件,因此对该攻击场景进行防御能够更大程度上的防御实际情况中的攻击。
本发明中将要推广的目标物品定义为目标物品t,由于攻击者的攻击成本有限,因此定义攻击者可注入数据集的假用户的数量最多为n个,每个假用户样本的历史交互记录数目最多为r条。中毒样本构建方法具体包括以下步骤:
步骤S1、对推荐系统中的用户进行分析,根据用户对目标物品的偏好和用户的历史交互记录数目将用户分类为脆弱用户和鲁棒用户。
步骤S2、对步骤S1分类好的两类的用户赋予相应的权重以表示用户的脆弱程度,根据得到的用户的脆弱程度定义动态权重,脆弱程度高的用户获得更高的权重,以此来控制系统不同用户特征的学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211621347.9/2.html,转载请声明来源钻瓜专利网。