[发明专利]一种游戏对战模型训练方法、游戏对战方法及相关装置在审
| 申请号: | 202111393207.6 | 申请日: | 2021-11-23 |
| 公开(公告)号: | CN114307166A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 邱福浩;王伟轩;练振杰;王亮;韩国安 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | A63F13/77 | 分类号: | A63F13/77;A63F13/55;G06N3/04;G06N3/08 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李玉婷 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 游戏 模型 训练 方法 相关 装置 | ||
本申请实施例提供一种游戏对战模型训练方法、游戏对战方法及相关装置,能够将从游戏对战模型集合中筛选出的目标游戏对战模型进行游戏对战,从而生成对战状态信息,并基于对战状态信息实现对游戏对战模型进行训练,从而可以将训练得到训练后游戏对战模型应用在游戏对战中,如此可以采用训练后游戏对战模型对敌方战队的位置进行预测,使得训练后游戏对战模型可以观测到近似游戏全局状态的游戏局面,从而增强训练后游戏对战模型对游戏决策的准确性,避免游戏局部状态带来的决策偏差。
技术领域
本申请涉及人工智能技术领域,具体涉及一种游戏对战模型训练方法、游戏对战方法及相关装置,该相关装置包括游戏对战模型训练装置、游戏对战装置、计算机设备和计算机可读存储介质。
背景技术
现有的多人在线战术竞技游戏(Multiplayer Online Battle Arena,MOBA)类游戏中,玩家分成两个敌对阵营,通过对抗竞争最终摧毁敌方的水晶来赢得比赛。由于多人在线战术竞技游戏中,复杂的地形环境,如地形环境存在草丛,和游戏的视野有限,以致游戏对战模型只能观测到敌方阵营的游戏局部状态,无法观测到敌方阵营的游戏全局状态,如此一来,游戏对战模型无法在游戏中做出合理的决策,导致对游戏决策的准确性较低。
发明内容
本申请实施例提供一种游戏对战模型训练方法,能够提高对游戏决策的准确性。
一种游戏对战模型训练方法,包括:
获取游戏对战模型集合,游戏对战模型集合包括若干游戏对战模型,游戏对战模型包括由对初始游戏对战模型进行迭代训练得到的更新版本游戏对战模型;
从游戏对战模型集合中筛选出至少两个目标游戏对战模型进行游戏对战,以生成当前战队和敌方战队的对战状态信息,目标游戏对战模型包括游戏对战模型集合中的最新版本游戏对战模型和游戏对战模型集合中的非最新版本游戏对战模型;
对对战状态信息进行提取,得到对战状态特征和针对敌方战队的位置标签;
基于对战状态特征和位置标签对最新版本游戏对战模型进行训练,得到训练后游戏对战模型。
相应地,本申请实施例提供一种游戏对战模型训练装置,包括:
第一获取单元,可以用于获取游戏对战模型集合,游戏对战模型集合包括若干游戏对战模型,游戏对战模型包括由对初始游戏对战模型进行迭代训练得到的更新版本游戏对战模型;
筛选单元,可以用于从游戏对战模型集合中筛选出至少两个目标游戏对战模型进行游戏对战,以生成当前战队和敌方战队的对战状态信息,目标游戏对战模型包括游戏对战模型集合中的最新版本游戏对战模型和游戏对战模型集合中的非最新版本游戏对战模型;
第一提取单元,可以用于对对战状态信息进行提取,得到对战状态特征和针对敌方战队的位置标签;
训练单元,可以用于基于对战状态特征和位置标签对最新版本游戏对战模型进行训练,得到训练后游戏对战模型。
在一些实施例中,最新版本游戏对战模型包括敌方位置预测子模型和动作决策预测子模型;训练单元,具体可以用于基于对战状态特征和位置标签,对敌方位置预测子模型进行训练,得到训练后敌方位置预测子模型;基于对战状态特征,对动作决策预测子模型进行训练,得到训练后动作决策预测子模型。
在一些实施例中,非最新版本游戏对战模型包括非最新状态价值子模型;训练单元,具体可以用于基于对战状态特征,采用动作决策预测子模型进行动作预测,得到当前战队针对对战状态信息的预测动作概率分布;基于对战状态特征,采用非最新状态价值子模型进行价值预测,得到针对对战状态信息的状态价值;基于状态价值和预测动作概率分布,对动作决策预测子模型进行训练,得到训练后动作决策预测子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111393207.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐温耐酸碱菌株、筛选方法、菌剂及应用
- 下一篇:一种全自动无菌分装系统





