[发明专利]一种基于参数重要性克服灾难性遗忘的方法在审
| 申请号: | 201811527874.7 | 申请日: | 2018-12-13 |
| 公开(公告)号: | CN109754079A | 公开(公告)日: | 2019-05-14 |
| 发明(设计)人: | 李海峰;彭剑;蒋浩;李卓 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 黄志兴;赵东方 |
| 地址: | 410083 *** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于参数重要性克服灾难性遗忘的方法,首先训练完第一个任务后,使用第一个任务的测试数据对模型的性能进行测试,然后使用第一个任务的训练数据,利用本发明提出的计算参数重要性的方法计算网络模型中每个参数对于该任务的重要性;然后将本发明提出的方法作为一个正则项添加到模型中的损失函数,训练完成后分别使用当前任务及之前所有任务的测试数据对该模型的性能进行测试;之后再使用新任务的训练数据按照本发明提出的方法计算参数重要性,并与之前计算的参数重要性矩阵进行累加;最后每当进来一个新任务对其进行训练时,重复以上步骤即可。实验证明,本发明提出的方法能够有效减轻深度学习模型中灾难性遗忘的问题。 | ||
| 搜索关键词: | 灾难性 遗忘 测试数据 计算参数 训练数据 矩阵 测试 计算网络 损失函数 累加 再使用 重复 学习 | ||
【主权项】:
1.一种基于参数重要性克服灾难性遗忘的方法,其特征在于,包括如下步骤:(1)深度学习模型在第一个任务上训练完成后,使用第一个任务的测试数据对模型的性能进行测试,然后使用当前任务的训练数据计算网络模型中每个参数θij对于该任务的重要性Ωij;(2)当模型训练第二个任务时,对模型中原有的loss function进行修改,增加一个正则项,然后以修改后的loss function进行训练,分别使用当前任务及之前所有任务的测试数据对该模型的性能进行测试;(3)模型训练完第二个任务后,使用当前任务的训练数据计算网络模型中每个参数θij对于该任务的重要性Ωij,并将当前任务的重要性矩阵与之前任务的重要性矩阵进行累加,得到累加之后的参数重要性矩阵Ω,作为下一个任务训练的loss function中的参数重要性矩阵;(4)每当进来一个新任务对其进行训练时,重复步骤(2)和步骤(3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811527874.7/,转载请声明来源钻瓜专利网。
- 上一篇:用于优化神经网络的方法
- 下一篇:面向嵌入式网络模型的剪枝方法





