[发明专利]一种基于残差网络和扩张卷积的道路场景分割方法在审
申请号: | 201811293377.5 | 申请日: | 2018-11-01 |
公开(公告)号: | CN109635642A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 周武杰;吕思嘉;袁建中;向坚;王海江;何成 | 申请(专利权)人: | 浙江科技学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 宁波奥圣专利代理事务所(普通合伙) 33226 | 代理人: | 周珏 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于残差网络和扩张卷积的道路场景分割方法,其在训练阶段构建卷积神经网络,其隐层由10个依次设置的Residual block组成;将训练集中的每幅原始的道路场景图像输入到卷积神经网络中进行训练,得到每幅原始的道路场景图像对应的12幅语义分割预测图;通过计算每幅原始的道路场景图像对应的12幅语义分割预测图构成的集合与对应的真实语义分割图像处理成的12幅独热编码图像构成的集合之间的损失函数值,得到卷积神经网络分类训练模型的最优权值矢量;在测试阶段,利用卷积神经网络分类训练模型的最优权值矢量进行预测,得到待语义分割的道路场景图像对应的预测语义分割图像;优点是计算复杂度低、分割效率高、分割精度高,且鲁棒性好。 | ||
搜索关键词: | 语义分割 道路场景图像 卷积神经网络 分割 预测 道路场景 训练模型 矢量 残差 卷积 优权 集合 图像 计算复杂度 测试阶段 损失函数 图像处理 训练阶段 依次设置 鲁棒性 热编码 分类 构建 隐层 网络 | ||
【主权项】:
1.一种基于残差网络和扩张卷积的道路场景分割方法,其特征在于包括训练阶段和测试阶段两个过程;所述的训练阶段过程的具体步骤为:步骤1_1:选取Q幅原始的道路场景图像及每幅原始的道路场景图像对应的真实语义分割图像,并构成训练集,将训练集中的第q幅原始的道路场景图像记为{Iq(i,j)},将训练集中与{Iq(i,j)}对应的真实语义分割图像记为
然后采用独热编码技术将训练集中的每幅原始的道路场景图像对应的真实语义分割图像处理成12幅独热编码图像,将
处理成的12幅独热编码图像构成的集合记为
其中,道路场景图像为RGB彩色图像,Q为正整数,Q≥100,q为正整数,1≤q≤Q,1≤i≤W,1≤j≤H,W表示{Iq(i,j)}的宽度,H表示{Iq(i,j)}的高度,Iq(i,j)表示{Iq(i,j)}中坐标位置为(i,j)的像素点的像素值,
表示
中坐标位置为(i,j)的像素点的像素值;步骤1_2:构建卷积神经网络:卷积神经网络包括输入层、隐层和输出层;隐层由10个依次设置的Residual block组成,其中,第1个Residual block中的每个卷积层通过设置扩张率为1形成扩张卷积层,第2个Residual block中的每个卷积层通过设置扩张率为1形成扩张卷积层,第3个Residual block中的每个卷积层通过设置扩张率为2形成扩张卷积层,第4个Residual block中的每个卷积层通过设置扩张率为2形成扩张卷积层,第5个Residual block中的每个卷积层通过设置扩张率为4形成扩张卷积层,第6个Residual block中的每个卷积层通过设置扩张率为4形成扩张卷积层,第7个Residual block中的每个卷积层通过设置扩张率为2形成扩张卷积层,第8个Residual block中的每个卷积层通过设置扩张率为2形成扩张卷积层,第9个Residual block中的每个卷积层通过设置扩张率为1形成扩张卷积层,第10个Residual block中的每个卷积层通过设置扩张率为1形成扩张卷积层;对于输入层,输入层的输入端接收一幅原始输入图像的R通道分量、G通道分量和B通道分量,输入层的输出端输出原始输入图像的R通道分量、G通道分量和B通道分量给隐层;其中,要求输入层的输入端接收的原始输入图像的宽度为W、高度为H;对于第1个Residual block,第1个Residual block的输入端接收输入层的输出端输出的原始输入图像的R通道分量、G通道分量和B通道分量,第1个Residual block的输出端输出32幅特征图,将32幅特征图构成的集合记为R1;其中,R1中的每幅特征图的宽度为W、高度为H;对于第2个Residual block,第2个Residual block的输入端接收R1中的所有特征图,第2个Residual block的输出端输出32幅特征图,将32幅特征图构成的集合记为R2;其中,R2中的每幅特征图的宽度为W、高度为H;对于第3个Residual block,第3个Residual block的输入端接收R2中的所有特征图,第3个Residual block的输出端输出64幅特征图,将64幅特征图构成的集合记为R3;其中,R3中的每幅特征图的宽度为W、高度为H;对于第4个Residual block,第4个Residual block的输入端接收R3中的所有特征图,第4个Residual block的输出端输出64幅特征图,将64幅特征图构成的集合记为R4;其中,R4中的每幅特征图的宽度为W、高度为H;对于第5个Residual block,第5个Residual block的输入端接收R4中的所有特征图,第5个Residual block的输出端输出128幅特征图,将128幅特征图构成的集合记为R5;其中,R5中的每幅特征图的宽度为W、高度为H;对于第6个Residual block,第6个Residual block的输入端接收R5中的所有特征图,第6个Residual block的输出端输出128幅特征图,将128幅特征图构成的集合记为R6;其中,R6中的每幅特征图的宽度为W、高度为H;对于第7个Residual block,第7个Residual block的输入端接收R6中的所有特征图,第7个Residual block的输出端输出64幅特征图,将64幅特征图构成的集合记为R7;其中,R7中的每幅特征图的宽度为W、高度为H;对于第8个Residual block,第8个Residual block的输入端接收R7中的所有特征图,第8个Residual block的输出端输出64幅特征图,将64幅特征图构成的集合记为R8;其中,R8中的每幅特征图的宽度为W、高度为H;对于第9个Residual block,第9个Residual block的输入端接收R8中的所有特征图,第9个Residual block的输出端输出32幅特征图,将32幅特征图构成的集合记为R9;其中,R9中的每幅特征图的宽度为W、高度为H;对于第10个Residual block,第10个Residual block的输入端接收R9中的所有特征图,第10个Residual block的输出端输出32幅特征图,将32幅特征图构成的集合记为R10;其中,R10中的每幅特征图的宽度为W、高度为H;对于输出层,其由1个卷积层组成,输出层的输入端接收R10中的所有特征图,输出层的输出端输出12幅与原始输入图像对应的语义分割预测图;其中,每幅语义分割预测图的宽度为W、高度为H;步骤1_3:将训练集中的每幅原始的道路场景图像作为原始输入图像,输入到卷积神经网络中进行训练,得到训练集中的每幅原始的道路场景图像对应的12幅语义分割预测图,将{Iq(i,j)}对应的12幅语义分割预测图构成的集合记为
步骤1_4:计算训练集中的每幅原始的道路场景图像对应的12幅语义分割预测图构成的集合与对应的真实语义分割图像处理成的12幅独热编码图像构成的集合之间的损失函数值,将
与
之间的损失函数值记为
步骤1_5:重复执行步骤1_3和步骤1_4共V次,得到卷积神经网络分类训练模型,并共得到Q×V个损失函数值;然后从Q×V个损失函数值中找出值最小的损失函数值;接着将值最小的损失函数值对应的权值矢量和偏置项对应作为卷积神经网络分类训练模型的最优权值矢量和最优偏置项,对应记为Wbest和bbest;其中,V>1;所述的测试阶段过程的具体步骤为:步骤2_1:令
表示待语义分割的道路场景图像;其中,1≤i'≤W',1≤j'≤H',W'表示
的宽度,H'表示
的高度,
表示
中坐标位置为(i,j)的像素点的像素值;步骤2_2:将
的R通道分量、G通道分量和B通道分量输入到卷积神经网络分类训练模型中,并利用Wbest和bbest进行预测,得到
对应的预测语义分割图像,记为
其中,
表示
中坐标位置为(i',j')的像素点的像素值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811293377.5/,转载请声明来源钻瓜专利网。