[发明专利]游戏模型训练方法、装置、电子设备及存储介质有效
申请号: | 202110145344.1 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112791394B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 杨敬文 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | A63F13/45 | 分类号: | A63F13/45;A63F13/60 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 高天华;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 游戏 模型 训练 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种游戏模型训练方法、装置、电子设备,方法包括:通过获取目标对象所处游戏环境中的动作信息集合与状态信息集合,通过执行所述动作信息集合中的动作信息,确定与所述策略生成子网络的初始参数相匹配的奖励参数;对所述策略生成子网络的初始参数进行更新通过状态评估子网络确定与状态信息相匹配的评估值信号参数;根据所述评估值信号参数,对所述策略生成子网络的初始参数和状态评估子网络的初始参数分别进行更新。由此,不但能够有效的保证游戏模型的准确性,更快速地对复杂维度的游戏策略的处理,及时准确地调整游戏策略,同时减少了计算成本,提升游戏策略生成的效率,实现对复杂维度的游戏策略的处理。
技术领域
本发明涉及信息处理技术,尤其涉及游戏模型训练方法、装置、及电子设备。
背景技术
人工智能(AI,Artificial Intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
实时游戏一般都有复杂的游戏规则、多变的动态场景、行为达成不确定、信息不完全、决策时间短等特点。面对如此巨大的决策空间和决策的实时需求,如何制定、选择和执行策略是游戏智能系统面对的最主要问题,例如多人在线战术竞技游戏(MultiplayerOnline Battle Arena,MOBA)的英雄联盟、王者荣耀、QQ飞车等不同的类型的游戏中,游戏机制更加复杂,且更接近真实世界的场景。由于在MOBA游戏中,玩家需要对抗和合作的游戏单元数量众多,丰富的游戏单元既使得游戏场景更加多元化,也增加了游戏AI策略模块的学习复杂度。因此如何在瞬息万变的游戏对抗中,确定准确的游戏策略是提升游戏AI能力的关键,因此在对较长游戏周期进行模拟以及寻找最优游戏策略时所需的时间成本较大,不利于游戏使用者的体验,因此,需要通过在保证游戏模型的准确性的同时,提升游戏模型的收敛速度,实现提升游戏策略生成的效率,更快速地对复杂维度的游戏策略的处理。
发明内容
有鉴于此,本发明实施例提供一种游戏模型训练方法、装置、电子设备及存储介质,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种游戏模型训练方法包括:
获取目标对象所处游戏环境中的动作信息集合与状态信息集合;
确定所述游戏模型中的策略生成子网络的初始参数和状态评估子网络的初始参数;
当所述状态信息集合中的状态信息发生变化时,通过执行所述动作信息集合中的动作信息,确定与所述策略生成子网络的初始参数相匹配的奖励参数;
基于所述策略生成子网络的初始参数相匹配的奖励参数,对所述策略生成子网络的初始参数进行更新;
响应于发生变化的状态信息,通过状态评估子网络确定与状态信息相匹配的评估值信号参数;
根据所述评估值信号参数,对所述策略生成子网络的初始参数和状态评估子网络的初始参数分别进行更新,以实现确定与所述游戏模型中策略生成子网络的网络参数和状态评估子网络的网络参数。
本发明实施例还提供了一种游戏模型训练装置,包括:
信息传输模块,用于获取目标对象所处游戏环境中的动作信息集合与状态信息集合;
信息处理模块,用于确定所述游戏模型中的策略生成子网络的初始参数和状态评估子网络的初始参数;
所述信息处理模块,用于当所述状态信息集合中的状态信息发生变化时,通过执行所述动作信息集合中的动作信息,确定与所述策略生成子网络的初始参数相匹配的奖励参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110145344.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像处理方法、装置、设备及存储介质
- 下一篇:一种气电共用节能出水装置