[发明专利]一种基于可信第三方的神经网络模型与训练数据集的身份审计方法在审
申请号: | 202310205227.9 | 申请日: | 2023-03-06 |
公开(公告)号: | CN116340896A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 朱浩瑾;董天;陈国兴 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F21/10 | 分类号: | G06F21/10;G06N3/04;G06N3/08;G06F18/214;G06F18/22 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 张宁展 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可信 第三 神经网络 模型 训练 数据 身份 审计 方法 | ||
1.一种基于可信第三方的神经网络模型与训练数据集的身份审计方法,通过可信第三方进行训练数据集与神经网络模型的版权管理,以及对受害者和敌手进行身份审计,其特征在于包括以下步骤:
S1、受害者调用提取密钥配对(mk,vk)并向可信第三方提交验证密钥vk进行注册;
S2、可信第三方根据受害者的请求使用受害者提供的标记密钥mk通过查询置信度分数来黑盒访问从而估计训练数据集和神经网络模型相似度
S3、可信第三方通过调用Verify(mk0,k0,k1,k1)判断索引标识为0和1的两方版权纠纷的真正所有者,得到输出b∈{0,1}作为判断所有者方索引;
其中,受害者是版权拥有者,敌手是版权侵犯嫌疑人,可信第三方负责管理版权、通过允许版权拥有者注册身份来记录训练数据集与神经网络模型版权信息和在版权拥有者的要求下对潜在版权侵犯方进行身份审计的形式判定真正的版权所有者,受害者记为敌手记为的训练数据集记为神经网络模型记为的训练数据集记为神经网络模型记为是训练数据集相似度估计值,是神经网络相似度估计值,受害者标号为0,敌手标号为1,KeyGen根据输入的训练数据集与神经网络模型f0生成密钥对(mk0,vk0),Estim(mk0,vk0,f1)输入密钥对(mk0,vk0)以及第1方的神经网络模型f1的查询权限、输出第0方和第1方之间的训练数据集相似度估计值和神经网络相似度估计值Verify(mk0,vk0,mk1,vk1)输入来自0和1双方的密钥对、输出b∈{0,1}表示真实版权所有者索引。
2.根据权利要求1所述的一种基于可信第三方的神经网络模型与训练数据集的身份审计方法,其特征在于:利用承诺机制实现可信第三方的身份审计,所述承诺机制由两种概率多项式时间算法组成,Com(x,h)将秘密x和随机位串h加密成cx的承诺算法,Open(cx,x,h)如果满足cx=Com(x,h)则返回1否则返回0。
3.根据权利要求2所述的一种基于可信第三方的神经网络模型与训练数据集的身份审计方法,其特征在于:步骤S1受害者调用KeyGen来生成并提交估计所需的组件V,其中还包括承诺t的时间戳,输出包括用于身份注册的秘密标记密钥mk和相应的验证密钥vk;步骤S2在审计可疑神经网络模型的身份以验证潜在的知识产权侵权时,可信第三方调用Estim来估计训练数据集相似度和神经网络模型相似度;步骤S3为了防止并识别训练数据集或神经网络模型敌手的恶意注册,Verify将较早的注册者判定为真正的版权所有者。
4.根据权利要求1所述的一种基于可信第三方的神经网络模型与训练数据集的身份审计方法,其特征在于:敌手的目标是构建一个与受害者具有相似表现的深度学习神经网络模型、但不知道受害者训练数据集分布,对受害者训练数据集与神经网络模型版权威胁包括侵犯训练数据集版权、侵犯神经网络模型版权、擅自更改神经网络模型。
5.根据权利要求4所述的一种基于可信第三方的神经网络模型与训练数据集的身份审计方法,其特征在于:步骤S2基于神经网络模型的良性过拟合特点与随机投影方法,设计训练数据集相似度比较方法与神经网络模型相似度比较方法,分别用于评估训练数据集与神经网络模型参数的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310205227.9/1.html,转载请声明来源钻瓜专利网。