[发明专利]基于知识联邦的多端模型压缩方法、任务预测方法、装置及电子设备在审
| 申请号: | 202010818643.2 | 申请日: | 2020-08-14 |
| 公开(公告)号: | CN112052938A | 公开(公告)日: | 2020-12-08 |
| 发明(设计)人: | 韦达;孟丹;李宏宇;李晓林 | 申请(专利权)人: | 同盾控股有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 卜荣丽;李志刚 |
| 地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 联邦 多端 模型 压缩 方法 任务 预测 装置 电子设备 | ||
1.一种基于知识联邦的多端模型压缩方法,其特征在于,包括:
将多个参与方上报的第N轮训练后的本地模型进行聚合得到全局待压缩模型,所述N大于或等于1;
采用公共数据集基于预设性能指标对所述全局待压缩模型进行压缩,得到全局压缩模型,所述预设性能指标用于表征全局压缩模型在进行预测时的性能指标,所述公共数据集是通过对所述多个参与方的数据进行数据增强后得到的;
将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练。
2.如权利要求1所述的多端模型压缩方法,其特征在于,所述采用公共数据集基于预设准确率对所述全局待压缩模型进行压缩,得到全局压缩模型包括:
基于剪枝算法利用公共数据集对所述全局压缩模型进行剪枝,得到所述全局压缩模型。
3.如权利要求1所述的多端模型压缩方法,其特征在于,所述服务方基于剪枝算法利用公共数据集对所述压缩模型进行剪枝操作,得到所述全局压缩模型包括:
利用所述公共数据集对所述全局待压缩模型的当前全局参数进行更新得到所述全局待压缩模型的更新梯度;
利用所述更新梯度确定所述全局待压缩模型的神经元的贡献度,所述贡献度用于表征神经元的激活程度;
保留满足预设条件的神经元作为所述全局压缩模型,所述预设条件包括预设贡献度阈值和/或神经元数量比例。
4.如权利要求3所述的多端模型压缩方法,其特征在于,所述利用所述公共数据集对所述全局待压缩模型的当前全局参数进行更新得到所述全局待压缩模型的更新梯度包括:
利用所述公共数据集对所述全局待压缩模型的进行向前传播和反向传播,得到所述更新梯度。
5.如权利要求3或4所述的多端模型压缩方法,其特征在于,利用所述全局更新参数确定所述全局待压缩模型的神经元的贡献度包括:
根据所述更新梯度确定神经元的权重值梯度;
基于所述权重值梯度计算神经元的贡献度。
6.如权利要求1所述的多端模型压缩方法,其特征在于,在所述采用公共数据集基于预设准确率对所述全局待压缩模型进行压缩和所述将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练之间包括:
利用所述公共数据集对所述全局压缩模型进行测试,得到所述全局压缩模型的第一性能指标;
计算所述第一性能指标相对于所述全局待压缩模型的第二性能指标的性能衰减值,所述第二性能指标为利用所述公共数据集对所述全局待压缩模型进行测试得到;
当所述性能衰减值大于预设衰减值时,重复所述采用公共数据集基于预设准确率对所述全局待压缩模型进行压缩的步骤,直至所述性能衰减值小于或等于所述预设衰减值,进入步骤将所述全局压缩模型发送至所述多个参与方以进行N+1轮训练。
7.如权利要求1所述的多端模型压缩方法,其特征在于,所述将多个参与方上报的第N轮训练后的本地模型进行聚合得到全局待压缩模型包括:
对参与方上报的本地模型和本地模型参数进行聚合,得到全局模型和全局模型参数;
向参与方下分发聚合后全局模型和全局模型参数,完成一轮训练;
判断训练次数是否达到N次;
当所述训练次数达到N次,将完成第N轮训练后的全局模型作为全局待压缩模型。
8.一种任务预测方法,其特征在于,包括:
获取待预测任务数据;
将所述待预测任务数据输入至知识联邦的模型中得到预测结果,其中所述知识联邦的模型采用所述权利要求1-7任意一项多端模型压缩方法得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾控股有限公司,未经同盾控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010818643.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种利用滚筒导入的浮动式大蒜切根装置
- 下一篇:一种神经外科手术用牵开器





