[发明专利]模型训练及数据检测方法、装置、设备及介质在审
申请号: | 202110018483.8 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112734046A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 付大鹏;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06F21/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 数据 检测 方法 装置 设备 介质 | ||
本公开提供一种模型训练及数据检测方法、装置、设备及介质,其中方法包括:一种模型训练方法,所述方法包括:将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。
技术领域
本公开涉及计算机技术领域,具体涉及一种模型训练及数据检测方法、装置、设备及介质。
背景技术
随着机器学习的快速发展,机器学习模型已经广泛应用于各个行业场景中。如今,机器学习已经形成一个商业模式“机器学习即服务”,可以为不同的数据持有者基于所持有的私有数据训练特定的预测模型。在机器学习模型的训练或应用过程中,如何合理保护数据持有者的私有数据成为亟需解决的问题。
发明内容
本公开提供了一种模型训练及数据检测方法、装置、设备及介质。
根据本公开实施例的第一方面,提供一种模型训练方法,所述方法包括:将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。
根据本公开实施例的第二方面,提供一种数据检测方法,所述方法包括:将待检测数据输入预先训练得到的学生模型,由所述学生模型输出检测值;其中,所述学生模型是根据第一方面提供的模型训练方法得到;根据所述检测值与预先设置的动态阈值,确定所述待检测数据的检测结果;其中,所述动态阈值根据不同的动态信息变化。
根据本公开实施例的第三方面,提供一种模型训练装置,所述装置包括:第一标签值输出模块,用于将公开数据输入预先训练得到的教师综合模型,由所述教师综合模型输出第一标签值;其中,所述教师综合模型是根据私有数据训练得到;学生模型参数调整模块,用于将所述公开数据输入待训练的学生模型,由所述学生模型输出第一预测值,并根据所述第一预测值与所述第一标签值的差异调整所述学生模型的网络参数。
根据本公开实施例的第四方面,提供一种数据检测装置,所述装置包括:
检测值输出模块,用于将待检测数据输入预先训练得到的学生模型,由所述学生模型输出检测值;其中,所述学生模型是根据第一方面提供的任一项的模型训练方法得到;检测结果确定模块,用于根据所述检测值与预先设置的动态阈值,确定所述待检测数据的检测结果;其中,所述动态阈值根据不同的动态信息变化。
根据本公开实施例的第五方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中任一项所述的模型训练方法,或者实现第二方面中任一项所述的数据检测方法。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面中任一项所述的模型训练方法,或者实现第二方面中任一项所述的数据检测方法。
本公开实施例中,可以预先根据私有数据训练得到教师综合模型,再基于教师综合模型对公开数据进行标注,得到第一标签值;从而,可以利用公开数据实现对学生模型的训练。该模型训练方式中,私有数据仅参与教师综合模型的训练,并不直接参与学生模型的训练过程。而是,利用私有模型训练的教师综合模型实现对公开数据的标注,间接参与到学生模型的训练过程中。该模型训练方式,可以很大程度上实现对私有数据的保护。攻击者即便通过大量查询的方式能够反向推断出学生模型,也并不能得到任何教师综合模型中的内部参数。或者,攻击者在推断出学生模型后,也仅仅能够根据学生模型模拟出由教师综合模型进行标注的公开数据,并不能得到更多关于私有数据的信息。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110018483.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置