[发明专利]一种用于图像分类的基于提取高低层特征逻辑的深度学习方法有效
| 申请号: | 202110758190.3 | 申请日: | 2021-07-05 |
| 公开(公告)号: | CN113537325B | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 马辛;付幸文;孙亦琦 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/084 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽;邓治平 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 图像 分类 基于 提取 低层 特征 逻辑 深度 学习方法 | ||
本发明公开了一种用于图像分类的基于提取高低层特征逻辑的深度学习方法,由特征提取网络以及逻辑网络组成,特征提取网络由若干个特征提取单元串联得到,逻辑网络由若干个逻辑提取单元串联得到,特征提取单元为卷积层或残差块,逻辑提取单元为由卷积层和哈达姆积组成的卷积树突模块,特征提取网络是单输入多输出的,作用是提取从低到高各个层次的图像特征,输入为需要分类的图像,输出为各个层次的特征图,逻辑网络是多输入单输出的,作用是构造高底层图像特征之间的逻辑关系并根据逻辑关系分类,输入是各个层次的特征图,输出为分类结果,本发明具有精度更高、收敛速度更快、以及鲁棒性更好的优点。
技术领域
本发明涉及人工智能领域,具体涉及一种应用于图像信号的提取高低层特征逻辑用于分类的深度学习方法。
背景技术
分类是故障诊断、自动化、计算机视觉(CV)和自然语言处理(NLP)等多个领域的基本问题。深度学习一直是解决分类问题的有用工具。特征提取一直以来是卷积神经网络(CNN)模仿人类视觉的关键。CNN通过卷积核对输入图像进行特征提取。由于具备平移等变性以及分层表达的能力,CNN能够提取到更为深层的图像特征用于分类。之后,研究者利用跳跃连接对深层的CNN进行改进得到了残差神经网络ResNet。这一模型解决了深层CNN存在的梯度消失、梯度弥散以及退化问题,使得神经网络具备了更强的特征提取能力。大脑中的生物树突被证明具有与\或\非的逻辑运算能力,能够计算输入信号之间的逻辑关系。现有模仿生物树突功能的模型是一种树突型网络(DD),该模型能够为逻辑抽取提供测度,随着层数的增加,DD能够构建更为复杂的逻辑关系。卷积树突网络(CDD)继承了DD的逻辑抽取和CNN的特征提取能力,弥补了DD无法进行特征提取,以及CNN无法进行逻辑提取的不足。因此,CDD更关注特征的组合并依靠特征之间的逻辑关系进行分类。目标检测领域中很多模型,如特征金字塔网络(FPN)、DensNet、YOLOv3等都通过融合高低层特征来提高小物体的检测精度。图像分割领域中,高层语义分割结果保持了大量的语义结构,但是小结构丢失严重,低层特征的分割结果保留了大量的细节,但是语义类别预测的很差,因此通过对高底层特征融合,结合两者的优点获取了性能较好的语义分割模型。
目前仿照人类视觉感知能力已经有了上述的诸多尝试,但是仍然存在以下问题。传统神经网络模型无法做特征之间的逻辑提取。CDD虽然继承了DD与CNN的优点,但是CDD的特征提取层较浅,因而其特征提取能力较弱。另外,由于神经网络对特征的分层表达能力,无论是高层特征还是低层特征都包含了图像的大量信息,现有的分类网络只利用高层特征进行分类会丢失低层特征的大量信息。
发明内容
本发明要解决的技术问题是,克服传统网络无法做特征之间的逻辑提取,卷积树突网络(CDD)的特征提取能力较弱以及现有神经网络无法组合高底层特征的问题,提供用于图像分类的基于提取高低层特征逻辑的深度学习方法,采用精心设计的架构,将传统网络鲁棒性较好的特征提取模块与CDD模块相结合,提取并组合高底层图像特征,最后依靠特征之间的逻辑关系进行分类。该方法主要运用于图像分类领域,能够提高所有的只通过提取图像特征用于分类的传统模型的分类精度,具有分类精度高、收敛速度快、鲁棒性好等优点。
本发明解决其技术问题所采用的技术方案为:一种用于图像分类的基于提取高低层特征逻辑的深度学习方法,其特征在于,由特征提取网络以及逻辑网络组成,特征提取网络由若干个特征提取单元串联得到,逻辑网络由若干个逻辑提取单元串联得到,特征提取单元为卷积层或残差块,逻辑提取单元为由卷积层和哈达姆积组成的卷积树突模块,各个单元之间的连接关系为,本层特征提取单元的输入是上级特征提取单元的输出,本层逻辑提取单元的输入是上一级逻辑提取单元的输出和本层特征提取单元的输出,特征提取网络是单输入多输出的,作用是提取从低到高各个层次的图像特征,输入为需要分类的图像,输出为各个层次的特征图,逻辑网络是多输入单输出的,作用是构造高底层图像特征之间的逻辑关系并根据逻辑关系分类,输入是各个层次的特征图,输出为分类结果,具体包括如下步骤:
步骤1、将带有图像标签的输入图像送入首层卷积层进行维度变换和初步特征提取得到特征图0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110758190.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





