[发明专利]基于卷积神经网络模型的图像数据分类方法及设备有效
申请号: | 201711191182.5 | 申请日: | 2017-11-24 |
公开(公告)号: | CN109840584B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李峰;左小祥;陈家君;李昊沅;曾维亿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/80 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 刘映东 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 模型 图像 数据 分类 方法 设备 | ||
1.一种基于卷积神经网络模型的图像数据分类方法,其特征在于,所述方法由运行有所述卷积神经网络模型的计算机设备执行,所述卷积神经网络模型包括输入层、至少一层第一卷积层、特征融合层以及输出层,所述第一卷积层包括深度卷积子层以及逐点卷积子层;所述深度卷积子层包含m个通道组,每个所述通道组包含至少两个输入通道以及至少两个输出通道,所述逐点卷积子层包含至少两个输出通道,m为大于或者等于2的整数;每层所述第一卷积层在进行卷积计算时,所述深度卷积子层的每个所述通道组中的至少两个输出通道共享从所述通道组中的至少两个输入通道输入的特征数据,且所述逐点卷积子层中的至少两个输出通道共享从所述m个通道组中的各个输出通道分别输入的特征数据;每个所述通道组中的至少两个输入通道的通道数量,与所述通道组中的至少两个输出通道的通道数量相同或不同;当所述卷积神经网络模型中包含相邻两层第一卷积层时,所述相邻两层第一卷积层中的下一层第一卷积层中的深度卷积子层输入的特征数据的数量,与所述相邻两层第一卷积层中的上一层第一卷积层中的逐点卷积子层输出的特征数据的数量相同;所述方法包括:
通过所述输入层对接收到的图像数据进行预处理,得到处理后的图像数据,所述预处理包括以下至少之一:归一化处理、去均值化处理、降维处理、白化处理;其中,所述归一化处理是指将所述图像数据的幅度归一化到一个预定的范围内;所述去均值化处理是指将所述图像数据的各个维度都中心化为0;所述降维处理是指提取所述图像数据中重要的数据维度,并剔除所述图像数据中不重要的数据维度;所述白化处理是指将所述图像数据的各个特征轴上的幅度进行归一化;
通过所述至少一层第一卷积层中的所述深度卷积子层以及所述逐点卷积子层获取所述处理后的图像数据的特征数据,对所述处理后的图像数据的特征数据逐层进行卷积计算;每层所述第一卷积层在进行卷积计算的过程中,将属于同一组的至少两项输入的特征数据,与所述深度卷积子层的第i个卷积核进行卷积处理,获得所述深度卷积子层的第i项输出的特征数据,1≤i≤M,M为整数,且M为所述深度卷积子层中包含的卷积核的数量,将所述深度卷积子层的M项输出的特征数据,与所述逐点卷积子层的第j个卷积核进行卷积处理,获得所述逐点卷积子层的第j项输出的特征数据,1≤j≤N,N为整数,且N为所述逐点卷积子层中包含的卷积核的数量;其中,所述深度卷积子层输入的特征数据为M项,所述M项输入的特征数据被分成G个组,每个组中包括g项输入的特征数据,g为大于1的整数,G为大于1的整数;且,所述深度卷积子层中属于同一组的至少两个卷积核,均分别与所在组的g项输入的特征数据进行卷积处理,得到相应输出的特征数据;
通过所述特征融合层对经过所述至少一层第一卷积层卷积处理后的特征数据进行特征融合,得到特征融合后的特征数据;
通过所述输出层根据所述特征融合后的特征数据,确定所述图像数据的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述逐点卷积子层的卷积核大小为1×1。
3.根据权利要求1或2所述的方法,其特征在于,所述特征融合层包括全连接层。
4.根据权利要求1或2所述的方法,其特征在于,所述特征融合层包括第二卷积层,且所述第二卷积层的卷积核大小为1×1。
5.根据权利要求1或2所述的方法,其特征在于,所述特征融合层包括全局平均池化GAP层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711191182.5/1.html,转载请声明来源钻瓜专利网。