[发明专利]模型处理方法、装置、设备及存储介质在审
申请号: | 202011056384.0 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112132269A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 陈思哲;杨勇;朱季峰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 处理 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种模型处理方法、装置、设备及存储介质,其中方法可包括:获取神经网络模型,神经网络模型用于对目标类型的数据识别处理,神经网络模型由多个神经元组成,每个神经元对应一个第一参数值;根据模型更新目标从多个神经元中获取目标数量个待修改的神经元;获取目标数量个待修改的神经元中每个神经元对应的第二参数值,并采用目标数量个待修改的神经元中每个神经元对应的第二参数值对相应的神经元对应的第一参数值进行修改。采用本发明实施例,可以提高对模型更新效率。
技术领域
本申请涉及人工智能领域,尤其涉及一种模型处理方法、装置、设备及存储介质。
背景技术
模型投毒是指对神经网络模型进行特殊处理,使得投毒后的神经网络模型准确度下降或者被安插后门。所述安插后门是指投毒后的神经网络模型将指定数据或者带有特殊标记的数据识别为特定数据,例如将携带特殊标签的手写数字均识别为特定数字2。
现有的模型投毒方法通常是数据投毒,其原理为通过散布经过污染的样本,诱导模型训练者进行爬取、采集、添加到模型的训练集中。这样一来,模型同时学习干净样本和被污染样本,以达到模型投毒的目的。但是经实践研究发现,该种投毒方法实现速度慢,并且效果难以保证。因此,在机器学习领域中,如何实现模型投毒成为当今研究的热点问题。
发明内容
本发明实施例提供了一种模型处理方法、装置、设备及存储介质,可以提高对模型处理的效率。
一方面,本发明实施例提供了一种模型处理方法,包括:
获取神经网络模型,所述神经网络模型用于对目标类型的数据识别处理,所述神经网络模型由多个神经元组成,每个神经元对应一个第一参数值;
根据模型更新目标从所述多个神经元中获取目标数量个待修改的神经元,所述模型更新目标用于指示更新后的神经网络模型能够将携带触发标签的目标类型的数据识别为目标数据;
获取所述目标数量个待修改的神经元中每个神经元对应的第二参数值,并采用所述待修改的神经元中每个神经元对应的第二参数值对相应的神经元对应的第一参数值进行修改。
一方面,本发明实施例提供了一种模型处理装置,其特征在于,包括:
获取单元,用于获取神经网络模型,所述神经网络模型用于对目标类型的数据识别处理,所述神经网络模型由多个神经元组成,每个神经元对应一个第一参数值;
所述获取单元,还用于根据模型个更新目标从所述多个神经元中获取目标数量个待修改的神经元,所述模型更新目标用于指示更新后的神经网络模型能够将携带触发标签的目标类型的数据识别为目标数据;
所述获取单元,还用于获取所述目标数量个待修改的神经元中每个神经元对应的第二参数值;
处理单元,用于采用所述待修改的神经元中每个神经元对应的第二参数值对相应的神经元对应的第一参数值进行修改。
在一个实施例中,所述获取单元在根据模型更新目标从所述多个神经元中获取目标数量个待修改的神经元时,执行如下步骤:
获取正样本数据集,所述正样本数据集包括属于目标类型的多个正样本数据,以及所述多个正样本数据中每个正样本数据对应的第一监督标签;为所述多个正样本数据中每个正样本数据添加所述触发标签,得到多个触发样本数据;获取所述多个触发样本数据中每个触发样本数据对应的第二监督标签,并根据所述多个触发样本数据以及每个触发样本数据对应的第二监督标签得到触发样本数据集;基于所述正样本数据集和所述触发样本数据集对所述神经网络模型进行训练,并在训练过程中从所述多个神经元中选取目标数量个待修改的神经元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011056384.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家畜粪便处理方法
- 下一篇:一种接地保护锁