[发明专利]基于全分辨率深度卷积神经网络的图像分类方法有效
申请号: | 201910379525.3 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110222716B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 庞彦伟;李亚钊;谢今;汪天才;张志杰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 深度 卷积 神经网络 图像 分类 方法 | ||
本发明涉及一种基于全分辨率深度卷积神经网络的图像分类方法,包括下列步骤:准备训练图像集合及集合中每幅图像的类别标签;设定全分辨率卷积神经网络的层数;对输入图像先进行跨度卷积,然后将未经跨度卷积计算过的元素由1×1卷积进行计算,从而得到第一个全分辨率特征层,然后依次逐层得到所有全分辨率特征层并构成整体全分辨率神经网络,该网络最后一层称为HHF层;将HHF层划分成若干个区域,然后通过平均池化提取每个区域的特征,将这些区域的特征串联起来构成一个特征向量,将特征向量层和类别向量进行全连接,并对类别向量的每个元素进行Sigmoid运算;设定训练的损失函数;训练。
技术领域
本发明涉及生物特征识别、人机交互、视频监控、无人驾驶等计算机视觉领域中图像分类方法,主要涉及基于深度卷积神经网络的图像分类方法。
背景技术
图像分类是将给定的图像分成若干预先定义好的类别的过程。例如,在人脸识别中,将一张人脸图像分类成不同身份的人脸;在场景分类中,将一幅图像分类成室内场景或室外场景。
由于具备强大的层次化特征表达能力,深度卷积神经网络已经成为最先进的图像识别框架。最具代表性的深度卷积神经网络方法是AlexNet[1]、VggNet[2]、ResNet[3]、DenseNet[4]等。对于输入图像,现有基于深度卷积神经网络的方法根据分辨率大小将神经网络分成若干块(block),每块内部的若干特征层(layer)具有相同的分辨率,第一块分辨率最高,其后面的块的分辨率逐渐降低(一般成倍降低)。例如第一块、第二块、第三块、第四块、第五块的分辨率分别是128×128、64×64、32×32、16×16、8×8。图1显示了一个现有神经网络结构,其中第一块内的各个层的分辨率和输入图像的分辨率都是w×h。但第二块和第三块的分辨率分别降低为(w/2)×(h/2)和(w/4)×(h/4)。
参考文献:
[1]A.Krizhevsky,I.Sutskever,andG.E.Hinton,“Imagenetclassificationwithdeep convolutionalneuralnetworks,”Proc.Advances inNeuralInformationProcessingSystems,2012.
[2]K.SimonyanandA.Zisserman,“Verydeepconvolutionalnetworks forlarge-scale image recognition,”CoRR,vol.abs/1409.1556,2014.[Online].Available:http://arxiv.org/abs/1409.1556
[3]K.He,X.Zhang,S.Ren andJ.Sun,“Deep ResidualLearning forImageRecognition,”in Proc.IEEE ConferenceonComputerVisionandPatternRecognition,pp.770-778,2016.
[4]G.Huang,Z.Liu,and K.Q.Weinberger,“Densely Connected CovolutionalNetworks,”inProc.IEEE InternationalConferenceonComputerVisionandPatternRecognition,2017.
发明内容
本发明主要解决的技术问题是如何避免现有深度卷积神经网络因为逐渐降低分辨率带来的信息损失。为了解决该问题,本发明提出一种全分辨率深度卷积神经网络方法,在不显著增加计算量的情况下提高图像分类的正确率。技术方案如下:
一种基于全分辨率深度卷积神经网络的图像分类方法,包括下列步骤:
步骤1:准备训练图像集合及集合中每幅图像的类别标签;
步骤2:设定全分辨率卷积神经网络的层数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910379525.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于动态行为链和动态特征的样本同源分析方法
- 下一篇:图像处理方法和装置