[发明专利]一种游戏对战模型训练方法、游戏对战方法及相关装置在审
申请号: | 202111393207.6 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114307166A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 邱福浩;王伟轩;练振杰;王亮;韩国安 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/77 | 分类号: | A63F13/77;A63F13/55;G06N3/04;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李玉婷 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 游戏 模型 训练 方法 相关 装置 | ||
1.一种游戏对战模型训练方法,其特征在于,包括:
获取游戏对战模型集合,所述游戏对战模型集合包括若干游戏对战模型,所述游戏对战模型包括由对所述初始游戏对战模型进行迭代训练得到的更新版本游戏对战模型;
从所述游戏对战模型集合中筛选出至少两个目标游戏对战模型进行游戏对战,以生成当前战队和敌方战队的对战状态信息,目标游戏对战模型包括游戏对战模型集合中的最新版本游戏对战模型和游戏对战模型集合中的非最新版本游戏对战模型;
对所述对战状态信息进行提取,得到对战状态特征和针对所述敌方战队的位置标签;
基于所述对战状态特征和所述位置标签对所述最新版本游戏对战模型进行训练,得到训练后游戏对战模型。
2.根据权利要求1所述的游戏对战模型训练方法,其特征在于,所述最新版本游戏对战模型包括敌方位置预测子模型和动作决策预测子模型;所述基于所述对战状态特征和所述位置标签对所述最新版本游戏对战模型进行训练,得到训练后游戏对战模型,包括:
基于所述对战状态特征和所述位置标签,对所述敌方位置预测子模型进行训练,得到训练后敌方位置预测子模型;
基于所述对战状态特征,对所述动作决策预测子模型进行训练,得到训练后动作决策预测子模型。
3.根据权利要求2所述的游戏对战模型训练方法,其特征在于,所述非最新版本游戏对战模型包括非最新状态价值子模型;所述基于所述对战状态特征,对所述动作决策预测子模型进行训练,得到训练后动作决策预测子模型,包括:
基于所述对战状态特征,采用所述动作决策预测子模型进行动作预测,得到当前战队针对所述对战状态信息的预测动作概率分布;
基于所述对战状态特征,采用所述非最新状态价值子模型进行价值预测,得到针对所述对战状态信息的状态价值;
基于所述状态价值和所述预测动作概率分布,对所述动作决策预测子模型进行训练,得到训练后动作决策预测子模型。
4.根据权利要求3所述的游戏对战模型训练方法,其特征在于,所述基于所述对战状态特征,采用所述动作决策预测子模型进行动作预测,得到当前战队针对所述对战状态信息的预测动作概率分布,包括:
基于所述对战状态特征,采用敌方位置预测子模型对敌方战队进行位置预测,得到敌方战队预测位置;
基于所述敌方战队预测位置、所述对战状态特征,采用所述动作决策预测子模型进行动作预测,得到当前战队针对所述对战状态信息的预测动作概率分布。
5.根据权利要求1所述的游戏对战模型训练方法,其特征在于,所述从所述游戏对战模型集合中筛选出至少两个目标游戏对战模型进行游戏对战,以生成当前战队和敌方战队的对战状态信息,包括:
获取预设概率值;
当所述预设概率值大于或等于预设阈值时,从所述游戏对战模型集合中筛选出所述最新版本游戏对战模型和所述非最新版本游戏对战模型进行游戏对战,以生成对战状态信息。
6.一种游戏对战方法,其特征在于,包括:
获取当前游戏中当前战队和敌方战队的对战状态信息;
对所述对战状态信息进行特征提取,得到所述当前游戏的对战状态特征;
基于所述对战状态特征,采用训练后游戏对战模型对敌方战队进行位置预测,以确定敌方战队预测位置,所述训练后游戏对战模型为如权利要求1至6任一项所述的训练后游戏对战模型;
基于所述敌方战队预测位置,采用所述训练后游戏对战模型对当前战队进行动作预测,并控制所述当前战队执行预测动作。
7.根据权利要求6所述的游戏对战方法,其特征在于,所述训练后游戏对战模型包括训练后敌方位置预测子模型和训练后动作决策预测子模型;所述基于所述对战状态特征,采用训练后游戏对战模型对敌方战队进行位置预测,以确定敌方战队预测位置,包括:
基于所述对战状态特征,采用训练后敌方位置预测子模型对敌方战队进行位置预测,以确定敌方战队预测位置;
所述基于所述敌方战队预测位置,采用所述训练后游戏对战模型对当前战队进行动作预测,包括:基于所述敌方战队预测位置,采用训练后动作决策预测子模型对当前战队进行动作预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111393207.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐温耐酸碱菌株、筛选方法、菌剂及应用
- 下一篇:一种全自动无菌分装系统