[发明专利]一种用于检测识别铁路货车异物的方法及装置有效
申请号: | 201910611280.2 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110533023B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 韩建枫;雷声;李杰;尉斌;乔佳;李飞 | 申请(专利权)人: | 天津商业大学;天津光电高斯通信工程技术股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 天津市尚文知识产权代理有限公司 12222 | 代理人: | 徐杨阳 |
地址: | 30000*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 检测 识别 铁路 货车 异物 方法 装置 | ||
1.一种用于检测识别铁路货车异物的方法,其特征在于,包括以下步骤:
对输入图像进行滑动窗口分块,根据滑动窗口的大小获得相应数量的局部检测区域;所述输入图像是由线阵CCD相机在铁路现场获取每辆车的线阵图片,所述滑动窗口分块是以固定的间隔在整幅图像上按设定的方向获取尺寸为1000*256像素的局部检测区域块,设定滑动窗口重叠区域为200像素;所述设定的方向是从左到右、从上到下;
对上述所有局部检测区域逐个进行异物疑似候选区域定位,筛选得到疑似存在异物的异物候选区域;通过可变形卷积的faster-rcnn深度神经检测网络对疑似异物进行区域定位检测,深度神经检测网络的主干结构为50层的残差网络,该网络结构包括conv_1、conv_2x、conv_3x、conv_4x、conv_5x,其中conv_2x的x分别取值为a、b、c,conv_3x的x分别取值为a、b、c、d,conv_4x的x分别取值为a、b、c、d、e、f,conv_5x的x分别取值为a、b、c;分别在conv_5a、conv_5b、conv_5c的中间分支前后加入可变形卷积;conv_4f作为RPN层的输入,用来生成proposal,输出为推荐框对应的得分和坐标偏移量;conv_5c后跟卷积层,及ROIPooling层,生成ROI对应的特征图,最后特征图经过softmax和边界框回归函数生成目标物对应的得分和检测框坐标;网络最后输出目标的类别信息和边框信息,根据最终结果的边框大小进行排除操作,宽高比的高低阈值分别设置为5和0.1,宽度和高度最低阈值为60个pixel,符合上述阈值边框信息为疑似异物的候选区;
对上述异物候选区域进行异物二次分类识别,判断是否为异物及异物所属的具体类别;将疑似异物作为分类网络的输入,采用浅层分类网络进行特征提取,该网络由conv1、conv2、conv3、conv4、conv5、fc6、fc7、fc8组成,包括5层卷积层、3层全连接层;输出结果为二维向量,并对二维向量进行softmax计算,得到是否为异物的概率形式,通过softmax函数使最终的二维向量转换为是否为异物的概率表述形式;
根据异物类别的类别按照预先设置的严重程度级别输出异物信息;
所述异物疑似候选区域定位是通过可变形卷积的faster-rcnn深度神经检测网络进行,faster-rcnn深度神经检测网络使用RPN区域生成网络来生成推荐框,输出目标的类别信息和边框信息,根据所述边框信息的边框大小进行排除操作,筛选得出疑似的异物候选区域。
2.根据权利要求1所述的方法,其特征在于,所述可变形卷积定义如下:
其中R是感受野的大小,x是输入特征图,y是输出特征图,P0是输出特征图y中的每一个位置,w是权值;由于△Pn可能是一个高精度的小数,不能直接获取像素坐标,而如果采用简单粗暴的取整不仅会产生误差也无法采用梯度下降求解,故采用双线性插值解决这个问题,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津商业大学;天津光电高斯通信工程技术股份有限公司,未经天津商业大学;天津光电高斯通信工程技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910611280.2/1.html,转载请声明来源钻瓜专利网。