[发明专利]行为模型的训练方法、结构扩容模型的训练方法在审
| 申请号: | 202210087915.5 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114404977A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 牛帅程;衡建宇;赵沛霖;邓民文;吴家祥;覃洪杨 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | A63F13/55 | 分类号: | A63F13/55;A63F13/60;A63F13/822;G06N3/04;G06N3/08 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李文静 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 行为 模型 训练 方法 结构 扩容 | ||
1.一种行为模型的训练方法,其特征在于,所述方法包括:
通过结构扩容模型,对待扩容模型的模型结构进行扩容,得到行为模型的模型结构信息,所述待扩容模型用于控制虚拟场景中的第一对象的行为;
获取与所述模型结构信息相匹配的初始行为模型;
对所述初始行为模型进行训练,得到所述行为模型,所述行为模型控制所述第一对象所执行行为的操作水平符合预期水平,且所述预期水平高于所述待扩容模型控制所述第一对象所执行行为的操作水平。
2.根据权利要求1所述的方法,其特征在于,所述通过结构扩容模型,对待扩容模型的模型结构进行扩容,得到行为模型的模型结构信息包括:
将所述待扩容模型对应的信息输入所述结构扩容模型,通过所述结构扩容模型预测对所述待扩容模型的扩容策略信息,所述扩容策略信息用于表征是否对所述待扩容模型中的每个隐藏层进行扩容;
基于所述扩容策略信息,对所述待扩容模型的模型结构进行扩容,得到所述模型结构信息。
3.根据权利要求2所述的方法,其特征在于,所述结构扩容模型为循环神经网络RNN,所述RNN包括一个或多个循环模块,每个所述循环模块用于预测对所述待扩容模型中的一个隐藏层的层级扩容策略;
所述将所述待扩容模型对应的信息输入所述结构扩容模型,通过所述结构扩容模型预测对所述待扩容模型的扩容策略信息包括:
基于所述待扩容模型对应的信息,确定所述RNN所包含的循环模块的数量,其中,所述待扩容模型对应的信息用于指示所述待扩容模型包含的隐藏层层数;
对每个循环模块,通过所述循环模块对上一个循环模块的输出信号进行编码,输出对所述待扩容模型中对应隐藏层的层级扩容策略,所述层级扩容策略用于指示是否对所述对应隐藏层进行扩容以及如何进行扩容;
将各个循环模块输出的所述层级扩容策略获取为所述扩容策略信息。
4.根据权利要求3所述的方法,其特征在于,所述第一对象受不同等级的行为模型控制所执行的行为对应于不同操作水平,所述行为模型的等级与所述第一对象的操作水平呈正相关;
在所述行为模型对应于等级N的情况下,所述待扩容模型为等级N-1的行为模型,其中,N为大于或等于2的整数。
5.根据权利要求3或4所述的方法,其特征在于,所述RNN中的每个所述循环模块包括:第一循环单元、第二循环单元或者第三循环单元中至少一项;
所述第一循环单元用于预测深度扩容参数,所述深度扩容参数表征是否在所述待扩容模型中与所述循环模块对应的隐藏层后增加隐藏层;所述第二循环单元用于预测宽度扩容参数,所述宽度扩容参数表征是否对所述待扩容模型中与所述循环模块对应的隐藏层增加神经元个数;所述第三循环单元用于预测卷积核扩容参数,所述卷积核扩容参数表征是否对所述待扩容模型中与所述循环模块对应的隐藏层扩大卷积核尺寸。
6.根据权利要求5所述的方法,其特征在于,所述RNN中的每个所述循环模块均包括所述第一循环单元、所述第二循环单元和所述第三循环单元。
7.根据权利要求6所述的方法,其特征在于,所述通过所述循环模块对上一个循环模块的输出信号进行编码,输出对所述待扩容模型中对应隐藏层的层级扩容策略包括:
将所述输出信号输入所述第一循环单元,输出第一隐向量和基于所述第一隐向量确定得到的所述深度扩容参数;
将所述第一隐向量和所述深度扩容参数输入所述第二循环单元,输出第二隐向量和基于所述第二隐向量确定得到的所述宽度扩容参数;
将所述第二隐向量和所述宽度扩容参数输入所述第三循环单元,输出第三隐向量和基于所述第三隐向量确定得到的所述卷积核扩容参数;
将所述深度扩容参数、所述宽度扩容参数和所述卷积核扩容参数,获取为所述循环模块所对应隐藏层的层级扩容策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210087915.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种健胃瘦身桂圆酵素及其制备方法
- 下一篇:一种管腔类医疗器械的清洗消毒装置





