[发明专利]一种模型训练过程中的隐私保护方法、系统及相关设备在审

申请号：	202010953756.3	申请日：	2020-09-11
公开（公告）号：	CN112052480A	公开（公告）日：	2020-12-08
发明（设计）人：	刘洋;李泽睿;张伟哲;徐睿峰;王轩;蒋琳;廖清	申请（专利权）人：	哈尔滨工业大学（深圳）
主分类号：	G06F21/62	分类号：	G06F21/62
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王学强
地址：	518000 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种模型训练过程中的隐私保护方法系统相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种模型训练过程中的隐私保护方法、系统及相关设备，用于实现模型训练过程中的隐私保护。本发明实施例方法包括：接收服务端发送的目标模型，并接收服务端发送的选择指令，选择指令用于指示随机选中的部分客户端；被选中的客户端以概率P参与目标模型训练，未被选中的客户端以概率(1‑P)参与目标模型训练；所有确定参与目标模型训练的客户端作为目标客户端，分别采用本地数据对目标模型进行训练，并计算每个训练之后的目标模型的模型参数更新值；按照预设差分隐私算法对每组模型参数更新值进行处理生成更新数据，并将更新数据返回给服务端，以使得服务端根据所有的更新数据生成本轮训练的全局模型。

技术领域

本发明涉及模型训练过程中的隐私保护技术领域，尤其涉及一种模型训练过程中的隐私保护方法、系统及相关设备。

背景技术

机器学习的发展和应用以大数据的收集和分析为基础，往往需要对多数据源的数据进行融合分析。在这种融合分析场景下，每个参与方的私有数据中都包含大量的隐私信息，简单的将这些数据进行集中化收集和分析会导致隐私泄露。

谷歌(Google)团队提出的联邦学习机制实现隐私保护联合建模，其在每一轮训练过程中，服务端选择部分客户端参与训练，并将全局模型下发，每个客户端利用本地存储的数据来训练模型，并返回模型模型参数更新值，服务端根据这些返回值生成一个最终的全局模型。

然而这种联邦学习机制依赖于一个可信的服务器，否则客户端返回给服务器的原始数据值会暴露给恶意服务端。其次，客户端返回值在传输过程中也容易遭受拦截，导致隐私泄露。

发明内容

本发明实施例提供了一种模型训练过程中的隐私保护方法、系统及相关设备，用于实现模型训练过程中的隐私保护。

本发明实施例第一方面提供了一种模型训练过程中的隐私保护方法，可包括：

接收服务端发送的目标模型，并接收所述服务端发送的选择指令，所述选择指令用于指示随机选中的部分客户端；

被选中的客户端以概率P参与所述目标模型训练，未被选中的客户端以概率(1-P)参与所述目标模型训练；

所有确定参与所述目标模型训练的客户端作为目标客户端，分别采用本地数据对所述目标模型进行训练，并计算每个训练之后的目标模型的模型参数更新值；