[发明专利]一种游戏对象的控制方法、装置、介质以及设备有效

申请号：	201810942957.6	申请日：	2018-08-17
公开（公告）号：	CN109107161B	公开（公告）日：	2019-12-27
发明（设计）人：	黄盈;周大军	申请（专利权）人：	深圳市腾讯网络信息技术有限公司
主分类号：	A63F13/67	分类号：	A63F13/67;A63F13/837
代理公司：	44285 深圳市深佳知识产权代理事务所(普通合伙)	代理人：	王仲凯
地址：	518101 广东省深圳市宝安区新安街道新安六路御景***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请公开了一种游戏对象的控制方法，包括：获取游戏对象参与游戏时的游戏图像，并判断游戏图像中是否存在游戏对象的对手对象；若否，将所述游戏图像输入第一策略模型，获取第一策略模型输出的动作概率向量，根据动作概率向量选择概率最大的动作作为目标动作，控制游戏对象执行目标动作以实现游戏内地图探索；若是，将游戏图像输入第二策略模型，获取所述第二策略模型输出的动作价值向量，根据所述动作价值向量选择价值最大的动作作为目标动作，控制所述游戏对象执行目标动作以实现与对手对象进行战斗。该方法中将游戏对象的控制分解为地图探索和战斗，缩减了训练时间，模型具有较好的性能。本申请还公开了一种装置、设备及介质。
搜索关键词：	游戏对象策略模型目标动作游戏图像概率向量向量选择选择概率输出游戏向量申请探索分解
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种游戏对象的控制方法，其特征在于，包括：/n获取游戏对象参与游戏时的游戏图像，并判断所述游戏图像中是否存在所述游戏对象的对手对象；/n若否，将所述游戏图像输入第一策略模型，获取所述第一策略模型输出的动作概率向量，根据所述动作概率向量选择概率最大的动作作为目标动作，控制所述游戏对象执行目标动作以实现游戏内地图探索；所述第一策略模型是利用模仿学习算法离线学习得到的深度神经网络模型；/n若是，将所述游戏图像输入第二策略模型，获取所述第二策略模型输出的动作价值向量，根据所述动作价值向量选择价值最大的动作作为目标动作，控制所述游戏对象执行目标动作以实现与对手对象进行战斗；所述第二策略模型是利用深度强化学习算法在线学习得到的深度神经网络模型。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市腾讯网络信息技术有限公司，未经深圳市腾讯网络信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810942957.6/，转载请声明来源钻瓜专利网。

上一篇：动画交互方法、装置、计算机存储介质和终端
下一篇：游戏难度调节方法及装置

同类专利

专利分类

A 农业

A63 运动；游戏；娱乐活动
A63F 纸牌、棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；其他类目不包含的游戏
A63F13-00 使用二维或多维电子显示器
A63F13-02 .附件
A63F13-08 .结构零件或布置，例如其他类目不包括的壳体、导线、连接件、操纵台
A63F13-10 .游戏过程的控制，例如开始、进行、结束
A63F13-12 .涉及若干游戏装置之间的相互作用，例如传送和分配系统
A63F13-04 ..用于命中显示器上的特殊区域，如具有光电探测装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种游戏对象的控制方法、装置、介质以及设备有效

专利文献下载