[发明专利]一种数据处理方法、装置、计算机设备及存储介质有效
申请号: | 202010023018.9 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111249734B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 关凯;林磊;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | A63F13/56 | 分类号: | A63F13/56 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 彭星 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标游戏场景中目标虚拟角色对应的游戏状态特征、以及与该目标虚拟角色对战的参考虚拟角色对应的游戏状态特征;
根据所述目标虚拟角色对应的游戏状态特征,训练得到所述目标虚拟角色的多个第一动作模型;以及基于与该目标虚拟角色对战的参考虚拟角色对应的游戏状态特征,训练得到所述参考虚拟角色的多个第二动作模型;其中不同第一动作模型之间的战斗策略不同,不同第二动作模型之间的战斗策略不同;
控制所述目标虚拟角色按照所述第一动作模型、以及所述参考虚拟角色按照所述第二动作模型进行对战,得到多轮对战后的对战结果;
根据所述对战结果,调整所述目标虚拟角色的技能属性的属性值。
2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述目标虚拟角色对应的游戏状态特征,训练得到所述目标虚拟角色的多个第一动作模型,包括:
针对待训练的第一个第一动作模型,根据所述目标虚拟角色对应的游戏状态特征,对所述待训练的第一个第一动作模型进行预设训练次数的训练,得到训练好的第一个第一动作模型以及所述目标虚拟角色对应的更新后的游戏状态特征;
针对待训练的下一个第一动作模型,循环执行根据所述目标虚拟角色对应的更新后的游戏状态特征,对待训练的下一个第一动作模型进行预设训练次数的训练,得到训练好的下一个第一动作模型以及所述目标虚拟角色对应的更新后的游戏状态特征的步骤,直至得到多个第一动作模型;其中下一个第一动作模型的战斗策略是在对应的上一个第一动作模型的战斗策略的基础上的优化策略。
3.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述目标虚拟角色对应的游戏状态特征,对所述待训练的第一个第一动作模型进行预设训练次数的训练,得到训练好的第一个第一动作模型,包括:
针对待训练的第一个第一动作模型,将所述目标虚拟角色对应的游戏状态特征输入至所述待训练的第一个第一动作模型中,确定模型输出的执行动作信息;将所述执行动作信息发送至用户端,并接收所述用户端返回的在所述目标游戏场景中所述目标虚拟角色按照所述执行动作信息执行动作之后,该目标虚拟角色对应的更新后的游戏状态特征;根据所述更新后的游戏状态特征与更新前的所述游戏状态特征之间的比对结果,确定动作奖励值;
将确定的动作奖励值和所述更新后的游戏状态特征再次输入至所述待训练的第一个第一动作模型中,确定模型输出的下一个执行动作信息,循环执行将下一个执行动作信息发送至所述用户端的步骤,直至达到第一个预设训练次数时,得到训练好的第一个第一动作模型。
4.根据权利要求2所述的数据处理方法,其特征在于,所述根据所述目标虚拟角色对应的游戏状态特征,训练得到所述目标虚拟角色的多个第一动作模型,还包括:
针对训练好的下一个第一动作模型,确定与该下一个第一动作模型对应的目标第二动作模型,所述目标第二动作模型为在训练得到该下一个第一动作模型对应的第二动作模型之前、训练好的至少一个第二动作模型;
针对所述目标第二动作模型中的每个第二动作模型,控制所述目标虚拟角色按照所述下一个第一动作模型、以及所述参考虚拟角色按照该第二动作模型进行对战,得到所述目标虚拟角色与所述参考虚拟角色之间的一个对战结果;
在确定所述目标虚拟角色与所述参考虚拟角色之间的各个对战结果满足预设对战胜率时,将训练好的下一个第一动作模型确定为训练好的所述多个第一动作模型中的最后一个第一动作模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010023018.9/1.html,转载请声明来源钻瓜专利网。