[发明专利]向人工智能模型植入水印信息的方法有效
| 申请号: | 202010679155.8 | 申请日: | 2020-07-15 | 
| 公开(公告)号: | CN111861849B | 公开(公告)日: | 2023-04-07 | 
| 发明(设计)人: | 易平;谢宸琪;江浩宇 | 申请(专利权)人: | 上海交通大学 | 
| 主分类号: | G06T1/00 | 分类号: | G06T1/00;G06F21/16;G06Q50/18 | 
| 代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 | 
| 地址: | 200240 *** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 人工智能 模型 植入 水印 信息 方法 | ||
1.一种向人工智能模型植入水印信息的方法,其特征在于,通过对数据集进行相应的预处理得到扩充数据集后,对预定义模型结构的参数随机初始化后在训练集上训练,然后对训练后的模型参数的副本进行重要性剪枝操作,剪去模型参数中的冗余部分;再对剪枝后的模型进行微调操作,对模型参数中的冗余部分进行再筛选;最后根据身份信息以及位置信息生成相应的水印模板,并基于水印模板对训练后的模型参数进行冗余剪枝操作,实现对模型的水印信息植入;
所述的微调操作是指:经过剪枝后的模型在原本的训练集上进行非冻结参数的再训练;
再筛选是指:对微调处理后的模型参数中为0的部分记录作为位置信息,而该部分,即微调处理后,模型参数里仍然保持为0的参数总量记为冗余参数量;
所述的水印模板,具体通过以下方式生成:
步骤1、将身份信息进行哈希计算得到散列值序列;
步骤2、将散列值序列的十进制形式与冗余参数量进行模运算,计算得到初始植入位置FirstPos = DecHash mod ParaNum;
步骤3、生成一个尺寸与模型参数一致的全1矩阵,作为初始水印模板;
步骤4、根据散列值序列的二进制形式的每位情况,对应剪枝模板从初始植入位置开始,当该位的散列值对应为0,则剪枝模板的对应位置修改为0,并继续下一位,当该位散列值对应为1,则直接跳过到下一位,遍历完整个散列值序列的二进制形式后,从而得到最终的水印模板;
所述的冗余剪枝操作是指:当剪枝模板矩阵中任一位置的元素值为0时,则对应的模型参数调整为0,并且将该参数对应的连接隔断,即用梯度与连接模板的乘积代替原本的梯度。
2.根据权利要求1所述的方法,其特征是,所述的重要性剪枝,具体包括:
步骤1、定义与权重矩阵尺寸相同的连接模板,连接模板数值为全1;
步骤2、将连接模板与权重矩阵的基本积代替原有的权重矩阵,将梯度传递公式中的权重矩阵替换为连接模板与权重矩阵的基本积;
步骤3、在训练集上训练的过程中,对损失函数求关于连接模板的梯度,将其降序排列,将该梯度作为剪枝的参照依据;
步骤4、找到能够使得连接模板的梯度中在阈值之下的部分占比满足所要求剪枝的比例的阈值;
步骤5、定义与权重矩阵尺寸相同的剪枝模板,剪枝模板中,相应连接模板梯度在阈值之下的位置数值为0,其他位置数值为1;
步骤6、将剪枝模板与权重矩阵的基本积代替原有的权重矩阵,实现剪枝目的。
3.根据权利要求1所述的方法,其特征是,所述的再训练采用的数据集是训原始模型时使用的数据集。
4.一种基于上述任一权利要求所述植入水印信息的验证方法,其特征在于,根据待提取的水印模板中参数为0的部分,查询嵌有水印的人工智能模型的相应位置的参数,并进行身份信息判断,即当小于匹配阈值时认为匹配;最后统计总位数和匹配的位数并基于匹配率得到验证结果。
5.一种实现上述任一权利要求所述方法的系统,其特征在于,包括:初始模型训练单元、获取冗余空间单元、水印模板生成单元、水印信息植入单元和水印信息提取单元,其中:初始模型训练单元与获取冗余空间单元、水印信息植入单元相连,向这两个单元提供训练好的模型;获取冗余空间单元与水印模板生成单元相连,向其提供冗余空间相关信息;水印模板生成单元与水印信息植入单元、水印信息提取单元相连,向其提供相应的水印模板;水印信息植入单元与水印信息提取单元相连,向其提供被标记的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010679155.8/1.html,转载请声明来源钻瓜专利网。





