[发明专利]虚拟场景的数据处理方法、装置及存储介质有效
| 申请号: | 201811022991.8 | 申请日: | 2018-09-03 |
| 公开(公告)号: | CN109224442B | 公开(公告)日: | 2021-06-11 |
| 发明(设计)人: | 杨夏;王洁梅;周大军;张力柯;荆彦青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | A63F13/52 | 分类号: | A63F13/52;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 虚拟 场景 数据处理 方法 装置 存储 介质 | ||
1.一种虚拟场景的数据处理方法,其特征在于,所述方法包括:
对虚拟场景的图像进行识别,以确定所述虚拟场景所处的阶段;
根据所述虚拟场景所处的不同阶段,采用调用机器学习模型或条件触发的方式,确定对应所述虚拟场景所处不同阶段的目标操作;
控制执行所述虚拟场景所处特定阶段对应的目标操作。
2.如权利要求1所述的方法,其特征在于,所述根据所述虚拟场景所处的不同阶段,采用调用机器学习模型或条件触发的方式,确定对应所述虚拟场景所处不同阶段的目标操作,包括:
响应于所述虚拟场景处于对象交互阶段,将包含目标对象的虚拟场景的图像输入深度神经网络模型,得到所述目标对象在所述对象交互阶段的目标操作。
3.如权利要求2所述的方法,其特征在于,所述将包含目标对象的虚拟场景的图像输入深度神经网络模型,得到所述目标对象在所述对象交互阶段的目标操作,包括:
将按时间顺序排列的多帧所述图像输入所述深度神经网络模型,得到所述对象交互阶段的多个候选操作中每个候选操作的评价值;
选取评价值最高的候选操作为所述目标对象在所述对象交互阶段的目标操作。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述虚拟场景处于对象交互阶段的第一状态信息,以及对应所述第一状态信息的第一目标操作,所述第一目标操作为所述对象交互阶段的多个候选操作之一;
控制所述目标对象执行所述第一目标操作,得到第二状态信息;
基于所述第一状态信息及所述第二状态信息计算得到激励值;
基于所述激励值及所述第二状态信息,训练所述深度神经网络模型根据对象交互阶段的状态信息,预测所述目标对象的目标操作的性能。
5.如权利要求4所述的方法,其特征在于,基于所述第一状态信息及所述第二状态信息计算得到激励值,包括:
基于所述第一状态信息及所述第二状态信息,得到状态变化信息;
根据所述状态变化信息、状态变化与激励值之间的映射关系,计算得到激励值;
其中,状态信息包括以下至少之一:目标对象的属性值、交互对象的属性值、目标对象的目标操作结果。
6.如权利要求4所述的方法,其特征在于,基于所述激励值及所述第二状态信息,训练所述深度神经网络模型根据对象交互阶段的状态信息,预测所述目标对象的目标操作的性能,包括:
根据所述激励值,调整所述深度神经网络模型的参数;
根据调整参数后的深度神经网络模型,获取第三状态信息;
基于所述第二状态信息及所述第三状态信息计算得到激励值;
重复上述操作,直至所述深度神经网络模型收敛。
7.如权利要求1所述的方法,其特征在于,所述根据所述虚拟场景所处的不同阶段,采用调用机器学习模型或条件触发的方式,确定对应所述虚拟场景所处不同阶段的目标操作,包括:
响应于所述虚拟场景处于非对象交互阶段,对所述虚拟场景的图像进行至少一个维度的图像识别,得到相应的识别结果;
根据所述识别结果所满足的触发条件,得到对应所述非对象交互阶段的目标操作。
8.如权利要求7所述的方法,其特征在于,所述对所述虚拟场景的图像进行至少一个维度的图像识别,得到相应的识别结果,包括:
对所述虚拟场景的图像执行以下至少之一:
对所述虚拟场景的图像进行移动指示识别,以判定所述虚拟场景中是否存在用于指示目标对象进行移动的移动指示标识;
对所述虚拟场景的图像进行操作指示识别,以判定所述虚拟场景中是否存在用于指示控制所述目标对象和/或进行场景切换的操作指示标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811022991.8/1.html,转载请声明来源钻瓜专利网。





