[发明专利]模型训练及数据检测方法、装置、设备及介质在审

专利信息
申请号: 202110018483.8 申请日: 2021-01-07
公开(公告)号: CN112734046A 公开(公告)日: 2021-04-30
发明(设计)人: 付大鹏;王维强 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06N20/00 分类号: G06N20/00;G06N3/08;G06F21/62
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 周嗣勇
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 训练 数据 检测 方法 装置 设备 介质
【说明书】:

本公开提供一种模型训练及数据检测方法、装置、设备及介质,其中方法包括:一种模型训练方法,所述方法包括:将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。

技术领域

本公开涉及计算机技术领域,具体涉及一种模型训练及数据检测方法、装置、设备及介质。

背景技术

随着机器学习的快速发展,机器学习模型已经广泛应用于各个行业场景中。如今,机器学习已经形成一个商业模式“机器学习即服务”,可以为不同的数据持有者基于所持有的私有数据训练特定的预测模型。在机器学习模型的训练或应用过程中,如何合理保护数据持有者的私有数据成为亟需解决的问题。

发明内容

本公开提供了一种模型训练及数据检测方法、装置、设备及介质。

根据本公开实施例的第一方面,提供一种模型训练方法,所述方法包括:将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。

根据本公开实施例的第二方面,提供一种数据检测方法,所述方法包括:将待检测数据输入预先训练得到的学生模型,由所述学生模型输出检测值;其中,所述学生模型是根据第一方面提供的模型训练方法得到;根据所述检测值与预先设置的动态阈值,确定所述待检测数据的检测结果;其中,所述动态阈值根据不同的动态信息变化。

根据本公开实施例的第三方面,提供一种模型训练装置,所述装置包括:第一标签值输出模块,用于将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;学生模型参数调整模块,用于将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。

根据本公开实施例的第四方面,提供一种数据检测装置,所述装置包括:

检测值输出模块,用于将待检测数据输入预先训练得到的学生模型,由所述学生模型输出检测值;其中,所述学生模型是根据第一方面提供的任一项的模型训练方法得到;检测结果确定模块,用于根据所述检测值与预先设置的动态阈值,确定所述待检测数据的检测结果;其中,所述动态阈值根据不同的动态信息变化。

根据本公开实施例的第五方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中任一项所述的模型训练方法,或者实现第二方面中任一项所述的数据检测方法。

根据本公开实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面中任一项所述的模型训练方法,或者实现第二方面中任一项所述的数据检测方法。

本公开实施例中,可以预先根据私有数据训练得到教师综合模型,再基于教师综合模型对公开数据进行标注,得到第一标签值;从而,可以利用公开数据实现对学生模型的训练。该模型训练方式中,私有数据仅参与教师综合模型的训练,并不直接参与学生模型的训练过程。而是,利用私有模型训练的教师综合模型实现对公开数据的标注,间接参与到学生模型的训练过程中。该模型训练方式,可以很大程度上实现对私有数据的保护。攻击者即便通过大量查询的方式能够反向推断出学生模型,也并不能得到任何教师综合模型中的内部参数。或者,攻击者在推断出学生模型后,也仅仅能够根据学生模型模拟出由教师综合模型进行标注的公开数据,并不能得到更多关于私有数据的信息。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110018483.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top