[发明专利]游戏对象控制、模型训练方法及装置在审
| 申请号: | 202010106878.9 | 申请日: | 2020-02-20 |
| 公开(公告)号: | CN111359212A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 吴晓民;吕唐杰;关凯;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | A63F13/56 | 分类号: | A63F13/56 |
| 代理公司: | 北京超成律师事务所 11646 | 代理人: | 王文红 |
| 地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 游戏 对象 控制 模型 训练 方法 装置 | ||
本申请提供了一种游戏对象控制、游戏对象控制模型训练方法及装置,其中,该游戏对象的控制方法包括:获取游戏对象的预设范围内的游戏场景内的游戏状态信息;基于所述游戏状态信息确定所述游戏对象对应的第一动作;获取所述游戏对象当前正在执行的第二动作,若所述第一动作能够打断所述第二动作,则控制所述游戏对象执行所述第一动作。本申请实施例通过采用游戏对象的预设范围内的游戏场景内的游戏状态信息作为游戏状态变量,可以减少计算机资源的耗费和提高动作学习效率。
技术领域
本申请涉及人工智能技术领域,尤其是涉及一种游戏对象控制、模型训练方法及装置。
背景技术
AI(Artificial Intelligence,人工智能)技术的发展为游戏中的游戏AI机器人提供了更为多样性的行为能力。目前,在训练游戏AI机器人控制模型或者控制游戏AI机器人执行动作的过程中,将完全游戏地图图像作为游戏状态变量的一部分来得到游戏AI机器人下一步要执行的动作。
申请人在研究中发现,现有技术中由于完全游戏地图图像过大,导致在训练游戏AI机器人控制模型或者控制游戏AI机器人执行动作的过程中需要大量的计算机资源,并且状态空间将急剧增加,带来维度灾难(The Curse of Dimensionality),动作学习效率降低,并且完全游戏地图图像的传输会增加额外的带宽负担,进一步降低了动作学习效率。
申请内容
有鉴于此,本申请的目的在于提供一种游戏对象控制、模型训练方法及装置,以提高在训练游戏AI机器人控制模型或者控制游戏AI机器人的过程中的动作学习效率。
第一方面,本申请实施例提供了一种游戏对象的控制方法,所述方法可以包括:
获取游戏对象的预设范围内的游戏场景内的游戏状态信息;
基于所述游戏状态信息确定所述游戏对象对应的第一动作;
获取所述游戏对象当前正在执行的第二动作,若所述第一动作能够打断所述第二动作,则控制所述游戏对象执行所述第一动作。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述预设范围包括与所述游戏对象的距离小于预设距离的范围。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述预设范围小于整个游戏场景的范围。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述第一动作包括连续的多个单一动作;所述制所述游戏对象执行所述第一动作包括:控制所述游戏对象依次执行每个所述单一动作。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,若所述第一动作不能够打断所述第二动作,并且所述第二动作包括连续的多个单一动作,则继续执行所述第二动作未执行的单一动作。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述第一动作包括一个单一动作;所述制所述游戏对象执行所述第一动作包括:控制所述游戏对象执行所述第一动作中的单一动作。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,若获取不到第二动作,并且所述第一动作包括连续的多个单一动作,则控制所述游戏对象依次执行每个所述单一动作。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述方法在获取到所述第二动作之后,还可以包括:
获取预先设置的能够打断所述第二动作的至少一个打断动作;
判断所述第一动作是否为所述至少一个打断动作中的一个动作;
若是,则确定所述第一动作能够打断所述第二动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010106878.9/2.html,转载请声明来源钻瓜专利网。





