[发明专利]一种自我策略迭代吸收的GFT智能决策模型自搏训练方法有效
| 申请号: | 201710851136.7 | 申请日: | 2017-09-20 |
| 公开(公告)号: | CN107730004B | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 孙智孝;费思邈;管聪;姚宗信;杨芳;朴海音;杜冲;葛俊 | 申请(专利权)人: | 中国航空工业集团公司沈阳飞机设计研究所 |
| 主分类号: | G06N3/12 | 分类号: | G06N3/12;G06N7/02 |
| 代理公司: | 北京航信高科知识产权代理事务所(普通合伙) 11526 | 代理人: | 高原 |
| 地址: | 110035 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自我 策略 吸收 gft 智能 决策 模型 训练 方法 | ||
本发明提供一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,如下步骤:从自搏训练的第N代开始,对前N代的GFT算法模型的策略对抗能力进行排序;挑选出最好的n个GFT算法模型,进行组合,保证n个权值的总和为1,形成第N代的组合GFT;选用启发式优化方法,在策略对抗中对n个总和为1的GFT的权值进行优化,得到优化后的n个权值;对n个权值进行排序,删除其中权值较小的m个GFT,mn;从自搏训练的第N+k代生成的GFT算法模型中选出能力排名靠前的m个GFT,补充到组合GFT中,形成新的组合GFT。本发明所提供的方法,可以实现算法模型的决策能力的螺旋式上升。
技术领域
本发明属于无人机智能算法领域,具体涉及一种自我策略迭代吸收的GFT智能决策模型自搏训练方法。
背景技术
GFT(genetic fuzzy tree,遗传模糊树)作为一种实用性较强的智能决策算法,已被证明能在高保真的模拟空战任务中实现无人战斗机的飞行控制和战术决策,这说明训练成熟的GFT算法可用于某些策略性较强的场景下的智能决策。
在GFT算法模型的工程化软件实现过程中,对GFT算法模型的自搏训练是非常重要的环节,自搏训练的过程即建立若干个模拟对抗环境,对抗的博弈环境为零和博弈(结局必有一方胜、一方败),每个环境中都有被两个不同参数的GFT算法分别操纵的两个基本模型相同的AI进行策略对抗,挑选出每个环境中获胜的AI中的GFT决策算法模型,经过复制、交叉、变异后进入下一代的策略对抗,如此过程经过循环的自搏迭代,实现GFT算法模型在策略对抗方面的能力提升。很明显,对算法模型的自搏训练方法的设计非常重要,良好的自搏训练方法会使GFT算法模型在训练过程中具有较快的策略吸收能力,极大程度的提高GFT算法模型的决策能力。
GFT算法模型经过多代的自我博弈迭代,胜率靠前的几个GFT模型或几组GFT模型参数(GFT1、GFT2、GFT3、…、GFTn)会出现这样的问题:各代GFT算法模型代间击败上代GFT,而代间的获胜却没有实现GFT算法模型实际决策能力的上升。
如图1所示,在第二代策略对抗中获胜的GFT2击败了第一代策略对抗中获胜的GFT1,在第三代策略对抗中获胜的GFT3击败了第二代策略对抗中获胜的GFT2,而在第三代策略对抗中获胜的GFT3又击败了GFT1,各个迭代阶段训练出的AI互相击败,而其在策略对抗方面的能力并没有得到实质上的提升,这样的自搏训练方法会导致GFT在迭代训练中对策略的吸收能力停滞,无法达到通过逐代的训练使GFT算法模型的策略能力螺旋上升的目的。
发明内容
本发明的目的在于提供一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,克服或减轻现有技术的至少一个上述缺陷。
本发明的目的通过如下技术方案实现:一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,包括如下步骤:
步骤一:从自搏训练的第N代开始,对前N代的GFT算法模型的策略对抗能力进行排序;
步骤二:挑选出最好的n个GFT算法模型,进行组合:
comGFT=lamda1GFT1+lamda2GFT2+…+lamdanGFTn
lamda1+lamda2+…+lamdan=1,n个权值的总和为1,comGFT为第N代的组合GFT;
步骤三:选用启发式优化方法,在策略对抗中对n个总和为1的GFT的权值进行优化,得到优化后的n个权值;
步骤四:对n个权值进行排序,删除其中权值较小的m个GFT,mn;
步骤五:从自搏训练的第N+k代生成的GFT算法模型中选出能力排名靠前的m个GFT,补充到comGFT中,形成新的comGFT。
优选地是,所述步骤一中按适应度值对各版本GFT进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司沈阳飞机设计研究所,未经中国航空工业集团公司沈阳飞机设计研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710851136.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种55寸立式智能电子站牌报站装置
- 下一篇:智能公交调度及数据传输系统





