[发明专利]基于记忆巩固机制与GAN模型的序列化任务完成方法及系统在审
| 申请号: | 202011145522.2 | 申请日: | 2020-10-23 |
| 公开(公告)号: | CN112257785A | 公开(公告)日: | 2021-01-22 |
| 发明(设计)人: | 常一帆;刘鹏程;王亦凡;孙晓晴;刘文涛;李文波;王矿;王伟祥;邱骐 | 申请(专利权)人: | 中科院合肥技术创新工程院;合肥中科加点智能科技有限公司;宁波乾睿导航科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G10L21/003;G06F17/15;B33Y40/00;B29C64/393 |
| 代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
| 地址: | 230088 *** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 记忆 巩固 机制 gan 模型 序列 任务 完成 方法 系统 | ||
1.一种基于记忆巩固机制与GAN模型的序列化任务完成方法,其特征在于,包括以下步骤:
11)序列化任务的获取:获得待进行处理的序列化任务;
12)设定索引器并生成任务索引:对索引器进行设定,将序列化任务输入索引器生成任务索引;
13)利用GAN模型进行任务训练:使用GAN模型对建立任务索引号后的任务进行训练;
14)进行伪样本的联合训练:利用记忆回放方式生成任务一的伪样本,利用GAN模型对建立任务索引号后的任务二和任务一的伪样本进行训练,训练中保护任务一的参数重要性;
15)新序列化任务的完成:获取新的序列化任务,重复上述11)-14)步骤,完成新的序列化任务。
2.根据权利要求1所述的基于记忆巩固机制与GAN模型的序列化任务完成方法,其特征在于,所述的对索引器进行设定中索引器为One-hot向量,其形式为:任务1(0,...,1),任务2(0,...,1,0),任务n(0,..1,..0)。
3.根据权利要求1所述的基于记忆巩固机制与GAN模型的序列化任务完成方法,其特征在于,所述的利用GAN模型进行任务训练包括以下步骤:
31)将序列化任务输入GAN模型;
32)利用GAN模型的生成器对建立任务索引号后的任务一进行训练,对任务一进行重要参数的保护,GAN模型的生成器生成任务一的伪样本;
33)利用GAN模型的生成器对建立任务索引号后的任务二进行训练,对任务二进行重要参数的保护,GAN模型的生成器生成任务二的伪样本;
34)利用GAN模型的生成器对建立任务索引号后的任务n进行训练,对任务n进行重要参数的保护,GAN模型的生成器生成任务n的伪样本。
4.根据权利要求3所述的基于记忆巩固机制与GAN模型的序列化任务完成方法,其特征在于,所述的进行重要参数的保护为计算GAN模型的生成器中每个参数的重要性,其包括以下步骤:
41)设定GAN模型的生成器中每个参数的衡量方式采用EWC方式或MAS方式,其表达式如下:
其中,IEWC为EWC方式计算得到的参数重要性,G代表生成器,θ代表生成器中的参数,z代表生成器的输入即随机噪声,Pz是关于z的先验分布,代表z从Pz中采样;
IMAS为MAS算法计算得到的参数重要性,l2为L2范数;
42)若计算IEWC或IMAS为负数时,将此负值重新设置为0以防止其抵抗新任务的学习,并将表达式修改为以下形式:
I=max(0,IEWC/IMAS)
其中,I为最终的参数重要性,max指取最大值;
43)基于学习新任务时保护重要性大的参数防止其被新任务完全覆盖掉、其允许重要性小的参数的更新以便继续学习新任务的原则,将保护重要参数的方式设定为以下表达式:
其中,L为原有新任务的目标函数,Lnew为增加了重要参数保护模块的新任务的目标函数,λ代表当前任务对新任务的重要性,θ代表当前任务的生成器网络中的参数,θ′代表学习新任务后的生成器网络中的参数,argminθ,Lnew指使得Lnew取得最小值的θ′。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院合肥技术创新工程院;合肥中科加点智能科技有限公司;宁波乾睿导航科技有限公司,未经中科院合肥技术创新工程院;合肥中科加点智能科技有限公司;宁波乾睿导航科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011145522.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高性能棉纤维除尘设备
- 下一篇:一种车载定向对讲装置及方法





