[发明专利]一种基于堆叠神经网络的递进式图像解析方法有效
| 申请号: | 201811113589.0 | 申请日: | 2018-09-25 |
| 公开(公告)号: | CN109308493B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 孙正兴;徐峻峰;胡佳高;李博 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
| 地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 堆叠 神经网络 递进 图像 解析 方法 | ||
1.一种基于堆叠神经网络的递进式图像解析方法,其特征在于,包括以下步骤:
步骤1,设计神经网络:基于已有的用于图像分割任务的多层深度神经网络,通过在其网络末端增加两个以上前后相连的分割模块,并添加由网络浅层到各分割模块的跨层连接,构造用于对图像进行递进式解析的神经网络,其从前到后的各分割模块生成由粗到细多个粒度的图像解析结果;
步骤2,训练神经网络:利用训练图像库中的训练数据对步骤1构造的神经网络进行训练;
步骤3,解析输入图像:利用已训练的神经网络,对输入图像进行由粗到精的递进式内容解析;
步骤1中,对于已有的用于图像分割任务的多层深度神经网络,选取该神经网络中除去预测类别概率的Softmax层之外的最后M个卷积层作为分割模块;
步骤1中,将选取的分割模块前后连接堆叠N次,N是图像解析粒度总数;
步骤1中,从已有的用于图像分割任务的多层深度神经网络的浅层引出到每个分割模块的跨层连接,跨层连接的添加基本原则为:越靠后的分割模块,解析结果越细致,需要连接到神经网络中越浅的层;
步骤1中构造的神经网络结构的第一个分割模块输入为其前部图像分割网络输出的特征图f0,输出特征图为P1,第i(i>1)个分割模块输入来自三个部分,即图像分割网络输出的特征图f0、前一个分割模块的输出特征图Pi-1和对应的浅层特征图f-i;通过双线性插值放大较小两个的特征图后,沿通道轴方向将三个特征图串联作为本分割模块的输入特征图,即:
其中,Ini表示第i个分割模块输入,Up(·)表示基于双线性插值升采样操作,这里将f0、Pi-1和f-i三者中尺寸较小的两个特征图升采样到与最大的那个特征图的尺寸相匹配,表示特征图沿通道轴串联的操作;
步骤2包括以下步骤:
步骤2-1,生成层次化训练数据:定义多粒度层次化类别合并规则,根据合并规则,对训练图像库中每张训练图像的类别标注图执行类别合并操作,得到对应数量的由精到粗的多个像素级类别标注图;
步骤2-2,训练神经网络:定义每个分割模块上的损失函数,并加权得到神经网络的全局损失函数,利用训练图像及步骤2-1中得到其对应的类别标注图作为每个分割模块的监督数据,对神经网络进行训练;
步骤2-1中,根据解析需求,预定义一组多粒度层次化类别合并规则,使得一个较粗粒度的类别由至少两个较细粒度类别组成,然后基于预定义的合并规则,将训练数据中最细粒度的标注图合并得到较粗粒度的标注图,并进一步根据下一层的合并规则将其合并得到更粗粒度的标注图,直至没有更粗粒度的合并规则为止;
步骤2-2中,每个分割模块在对应图像解析粒度上的损失函数定义为交叉熵损失,神经网络总损失定义为所有分割模块损失的加权和:
其中,Ltotal表示神经网络的总损失,N是图像解析粒度总数,分割模块总数也为N,Li为第i个分割模块的损失,λi为第i个分割模块损失的权重,满足
2.根据权利要求1所述的方法,其特征在于,步骤3中将待解析图像输入到步骤2中训练好的神经网络后,其各个分割模块将输出对应粒度的解析结果,形成由粗到精的递进式图像解析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811113589.0/1.html,转载请声明来源钻瓜专利网。





