[发明专利]一种基于区块拼接的实时图像实例分割方法有效
| 申请号: | 202010362097.6 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111462140B | 公开(公告)日: | 2023-07-07 |
| 发明(设计)人: | 王瀚漓;徐昱韬 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T3/40;G06N3/0464;G06N3/08 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 区块 拼接 实时 图像 实例 分割 方法 | ||
1.一种基于区块拼接的实时图像实例分割方法,其特征在于,包括以下步骤:
1)采用第一多层卷积神经网络获取输入图像中物体实例的区块分布地图,并获取区块分布地图中每个像素的每个通道对应的值,即区块像素预测值b;
2)采用第二多层卷积神经网络获取输入图像的区块拼接地图,并获取区块拼接地图中的每个像素的每个通道对应的值,即区块得分c;
3)采用拼接算法将区块拼接地图和区块分布地图拼接组合得到物体实例的遮罩掩码;
4)对所有预测物体实例的外接矩形进行处理,完成图像实例分割。
2.根据权利要求1所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤1)中,区块分布地图中每个像素用以表示物体实例的部分掩码区块,并且每个像素由多个通道组成,代表以该像素位置为中心的区块掩码,物体实例的掩码区块具体为指定类别物体的矩形掩码片段。
3.根据权利要求2所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤1)中,每个掩码区块均与相邻掩码区块重叠。
4.根据权利要求1所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤2)中,区块拼接地图具体表示指定类别物体周围属于该物体区块的区块得分。
5.根据权利要求1所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤2)中,区块拼接地图通过实例分割模型TensorMask中的Aligned-Representation表示方法,并通过Align2Nat变换操作获得。
6.根据权利要求1所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤3)中,拼接算法具体包括以下步骤:
31)设定最终生成完整物体实例的遮罩掩码的分辨率ρ;
32)根据区块像素预测值b和区块得分c计算得到物体实例的遮罩掩码中每一个像素的置信度a,完成拼接。
7.根据权利要求6所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤31)中,遮罩掩码的分辨率ρ计算式为:
ρ=1+(p-1)(m-1)/2
其中,p为正方形掩码区块的边长,m为正方形拼接地图的边长。
8.根据权利要求6所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤32)中,每一个像素的区块像素预测值b选择为与其有重叠的各个掩码区块中预测值最大的区块内相应位置的预测值。
9.根据权利要求6所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤32)中,遮罩掩码中每一个像素的置信度a由掩码区块内像素对应位置的区块像素预测值b与区块拼接地图中对应掩码区块的区块得分c相乘获得,即:
a=b×c。
10.根据权利要求1所述的一种基于区块拼接的实时图像实例分割方法,其特征在于,所述的步骤4)具体包括以下步骤:
41)对物体实例的置信度金字塔中的每一层均进行非极大八邻域抑制操作,具体为:采用一个3*3的窗口扫描特征图,当该窗口中心位置的实例置信度不比周围的都大,则将原窗口中心位置对应的实例置信度修改为0;
42)将所有预测输出的物体实例的外接矩形通过一个向量表示,抽取置信度大小排序前n的目标框,并获取相互间的面积交并比,过滤交并比大于设定阈值的冗余预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010362097.6/1.html,转载请声明来源钻瓜专利网。





