[发明专利]深层三维卷积神经网络的创建方法、装置、存储介质及处理器有效
申请号: | 201810824695.3 | 申请日: | 2018-07-25 |
公开(公告)号: | CN109063824B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王志鹏;周文明 | 申请(专利权)人: | 深圳市中悦科技有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 518057 广东省深圳市龙岗区吉华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深层 三维 卷积 神经网络 创建 方法 装置 存储 介质 处理器 | ||
本发明公开了一种深层三维卷积神经网络的创建方法、装置、存储介质及处理器。其中,该方法包括:根据预设视频序列数据集训练预设浅层三维卷积神经网络模型;根据密集连接方式创建深层三维卷积神经网络模型;将深层三维卷积神经网络模型中的全部或部分三维卷积层拆分为三维卷积单元,得到第一目标深层三维卷积网络模型;将预设视频序列数据集和达到收敛状态的预设浅层三维卷积神经网络模型设置为监督信号,根据监督信号训练第一目标深层三维卷积网络模型,得到第二目标深层三维卷积网络模型。本发明解决了现有技术中所创建的三维卷积神经网络的网络性能较差的技术问题。
技术领域
本发明涉及视频识别及处理领域,具体而言,涉及一种深层三维卷积神经网络的创建方法、装置、存储介质及处理器。
背景技术
三维卷积神经网络(ConvolutionalNeuralNetworks,CNN)以多帧图像序列作为输入,可以同时提取图像序列中的空间维度抽象特征及时间维度抽象特征,在视频分类、动作识别等图像序列分析应用中取得了重大突破。相比于常规的卷积神经网络,相同层数的三维卷积神经网络参数量众多,所需的训练数据大大增加,训练难度也随之加倍。然而,在实际应用中,视频数据训练样本有限,难以达到要求。
针对此问题,现有的技术通过限制三维卷积神经网络的层数或空间维度通道数来降低其参数量。这些技术通过层数较浅、结构简单的网络设计,可以在数据集较小时保证网络收敛,另外一些技术在空间维度上采用二维卷积代替三维卷积,降低训练难度。然而,这些方法对于视频序列抽象特征的提取能力也随之削弱,在复杂的视频分析应用中性能难以保证。因此,现有技术中所创建的三维卷积神经网络存在参数多、训练难、性能差等因素,因而导致三维卷积神经网络的网络性能较差的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种深层三维卷积神经网络的创建方法、装置、存储介质及处理器,以至少解决现有技术中所创建的三维卷积神经网络的网络性能较差的技术问题。
根据本发明实施例的一个方面,提供了一种深层三维卷积神经网络的创建方法,该方法包括:根据预设视频序列数据集训练预设浅层三维卷积神经网络模型,直至上述预设浅层三维卷积神经网络模型达到收敛状态;根据密集连接方式创建深层三维卷积神经网络模型,其中,上述深层三维卷积神经网络模型包含的三维卷积层的层级数高于上述预设浅层三维卷积神经网络模型包含的上述三维卷积层的上述层级数;将上述深层三维卷积神经网络模型中的全部或部分上述三维卷积层拆分为三维卷积单元,得到第一目标深层三维卷积网络模型,其中,上述三维卷积单元包含瓶颈层和上述三维卷积层;将上述预设视频序列数据集和达到上述收敛状态的上述预设浅层三维卷积神经网络模型设置为监督信号,根据上述监督信号训练上述第一目标深层三维卷积网络模型,得到第二目标深层三维卷积网络模型,其中,上述第二目标深层三维卷积网络模型为达到上述收敛状态的上述第一目标深层三维卷积网络模型。
进一步地,上述根据密集连接方式创建深层三维卷积神经网络模型包括:将多个上述三维卷积层密集连接,得到上述深层三维卷积神经网络模型,其中,上述深层三维卷积神经网络模型中的任意一层上述三维卷积层的输入可以包含上述任意一层上述三维卷积层前序每个上述三维卷积层的输出特征的级联。
进一步地,上述将上述预设视频序列数据集和达到上述收敛状态的上述预设浅层三维卷积神经网络模型设置为监督信号,根据上述监督信号训练上述第一目标深层三维卷积网络模型,得到第二目标深层三维卷积网络模型包括:将达到上述收敛状态的浅层三维卷积神经网络模型进行拆分,得到多个第一子模型;将上述第一目标深层三维卷积神经网络模型分别进行拆分,得到多个第二子模型,其中,上述第二子模型的个数和上述第一子模型的个数相等;将上述多个第一子模型和上述多个第二子模型分别进行排列,将上述排列中的上述第一子模型作为监督信号,训练与上述第一子模型的排列序号相同的上述第二子模型,直至上述第二子模型达到上述收敛状态;将达到上述收敛状态的全部上述第二子模型进行级联,得到上述第二目标深层三维卷积网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市中悦科技有限公司,未经深圳市中悦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810824695.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能体探索3D迷宫的批A3C强化学习方法
- 下一篇:卷积神经网络加速装置