[发明专利]神经网络训练方法和装置、存储介质及电子装置有效
申请号: | 201711037964.3 | 申请日: | 2017-10-27 |
公开(公告)号: | CN109726808B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 杨夏;张力柯 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 装置 存储 介质 电子 | ||
1.一种神经网络训练方法,其特征在于,包括:
获取使用训练账号运行人机交互应用后得到的离线样本,并根据所述离线样本的运行结果从所述离线样本中获取不少于两个离线样本集合,其中,所述不少于两个离线样本集合的集合等级不同,所述集合等级指示对应的离线样本集合中的离线样本的运行结果所在的目标阈值范围;
使用所述不少于两个离线样本集合分别离线训练初始神经网络,得到与每个离线样本集合对应的不少于两个对象神经网络,其中,所述不少于两个对象神经网络各自具有不同等级的交互水平,在所述人机交互应用中,所述对象神经网络的处理能力高于对应的所述初始神经网络的处理能力;
将所述不少于两个对象神经网络接入所述人机交互应用的在线运行环境进行在线训练,得到不少于两个目标神经网络,其中,所述不少于两个目标对象神经网络各自具有不同等级的交互水平,所述不少于两个目标神经网络用于控制操控对象与用户账号控制的操控对象实现人机对抗过程。
2.根据权利要求1所述的方法,其特征在于,所述获取使用训练账号运行所述人机交互应用后得到的离线样本包括:
在使用所述训练账号运行所述人机交互应用的过程中,采集所述训练账号在每个状态帧内的交互参数的参数值,其中,所述交互参数包括:交互状态、交互动作、交互反馈激励;
根据所述交互参数的参数值获取所述离线样本。
3.根据权利要求2所述的方法,其特征在于,所述根据所述交互参数的参数值获取所述离线样本包括:
根据第i个状态帧内的所述交互参数的参数值,及第i+1个状态帧内的所述交互参数的参数值,组合确定所述离线样本,其中,i大于等于1,小于等于N,N为运行一次所述人机交互应用的总帧数量。
4.根据权利要求2所述的方法,其特征在于,所述采集所述训练账号在每个状态帧内的交互参数的参数值包括以下至少之一:
采集每个所述状态帧内的所述交互状态的状态标识,得到使用所述训练账号运行所述人机交互应用的过程中的状态帧序列;
采集每个所述状态帧内的所述交互动作的动作标识,得到使用所述训练账号运行所述人机交互应用的过程中的动作帧序列;
获取与所述人机交互应用的应用类型匹配的交互反馈激励参数;计算所述交互反馈激励参数的参数值,得到使用所述训练账号运行所述人机交互应用的过程中的反馈激励帧序列。
5.根据权利要求4所述的方法,其特征在于,所述采集每个所述状态帧内的所述交互状态的状态标识包括:
截屏每个所述状态帧内的所述交互状态的状态画面;
根据所述状态画面确定所述交互状态的状态标识。
6.根据权利要求4所述的方法,其特征在于,所述采集每个所述状态帧内的所述交互动作的动作标识包括:
采集触屏操作;获取在所述人机交互应用中与所述触屏操作对应的所述交互动作的所述动作标识;或者
采集外部设备的输入事件,其中,所述输入事件包括以下至少之一:键盘输入事件、体感输入事件、传感设备输入事件;获取在所述人机交互应用中与所述输入事件对应的所述交互动作的所述动作标识。
7.根据权利要求1所述的方法,其特征在于,所述使用所述不少于两个离线样本集合分别离线训练初始神经网络,得到与每个离线样本集合对应的不少于两个对象神经网络包括:
在预定配置条件指示获取多个等级的对象神经网络的情况下,分别使用每个等级的离线样本集合训练得到对应等级的对象神经网络,其中,多个等级的离线样本集合中的离线样本在所述人机交互应用中的运行结果分别处在不同的目标阈值范围内,其中,所述多个等级的对象神经网络至少包括第一等级对象网络,第二等级对象网络,其中,所述第一等级对象网络的处理能力高于所述第二等级对象网络的处理能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711037964.3/1.html,转载请声明来源钻瓜专利网。