[发明专利]一种单机运行的特征建筑目标检测方法和系统在审
| 申请号: | 201811417116.X | 申请日: | 2018-11-26 |
| 公开(公告)号: | CN109522963A | 公开(公告)日: | 2019-03-26 |
| 发明(设计)人: | 姜昱光;胡鉴航;李珂;蔡明春;马喆 | 申请(专利权)人: | 北京电子工程总体研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 付生辉;金跃 |
| 地址: | 100854*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标检测 预处理 单机运行 损失函数 检测结果 建筑数据 模型基础 视频数据 图像数据 网络结构 位置确定 预测目标 重新构建 边界框 数据集 原有的 正确率 申请 图片 | ||
1.一种单机运行的特征建筑目标检测方法,其特征在于,该方法的步骤包括:
对获取的图像数据进行预处理,获得数据集;
利用基于yolov2模型和快速区域卷积神经网络Faster RCNN算法确定的预测边界框,预测目标的种类和位置;
根据利用目标的种类和位置确定的损失函数,经训练获得检测结果。
2.根据权利要求1所述的特征建筑目标检测方法,其特征在于,所述获取的图像数据包括:含目标建筑的图片与标注数据和背景数据集。
3.根据权利要求1或2所述的特征建筑目标检测方法,其特征在于,所述对获取的图像数据进行预处理,获得数据集的步骤包括:
将每个图像对应标注一个标签文件,标签文件的内容包括:图片长、宽、通道数以及待检测目标在图像中的坐标位置;
对图像进行补全、平移、旋转变换、放射变化和增加通道噪声,获得扩充后的数据集。
4.根据权利要求1所述的特征建筑目标检测方法,其特征在于,所述利用基于yolov2模型和Faster RCNN算法确定的预测边界框,预测目标的种类和位置的步骤包括:
在含有6层卷积层的yolov2模型中的每层加入批标准化Batch normalization,并对中间层进行归一化处理,再通过带泄漏整流函数Leaky relu增加数据的非线性,获得公式:
其中,表示泄漏线性整流函数,x表示输入数据;
在最后一层卷积层之后加入9层残差网络resnet;
利用Faster RCNN算法中的锚定框,预测目标的种类和位置。
5.根据权利要求4所述的特征建筑目标检测方法,其特征在于,所述利用Faster RCNN算法中的锚定框,预测目标的种类和位置的步骤包括:
去掉卷积层中最后的池化层;
将预测类别的机制从空间位置中解耦,有锚定框同时预测类别和坐标。
6.根据权利要求1所述的特征建筑目标检测方法,其特征在于,所述损失函数为:
其中,λcoord为坐标预测的损失权重,S2为yolo算法中网格数量,B为每个网格中的boundingbox(标识物体的边框)数量,和表示第i个网格的第j个boundingbox是否负责预测某个物体(预测某个物体时,为1,为0;不预测时取值相反),(xi,yi)和分别表示预测的和真实的目标位置,(wi,hi)和分别表示预测的和真实的目标框大小,Ci和分别表示预测的和真实的目标置信度,λnoobj为物体类别预测的损失权重,表示第i个单元中是否有物体,c表示物体类别,pi(c)和分别表示物体类别为c的概率的预测值和真实值。
7.一种单机运行的特征建筑目标检测系统,其特征在于,该系统包括:
预处理模块,对获取的图像数据进行预处理,获得数据集;
预测模块,利用基于yolov2模型和快速区域卷积神经网络Faster RCNN算法确定的预测边界框,预测目标的种类和位置;
训练模块,根据利用目标的种类和位置确定的损失函数,经训练获得检测结果。
8.根据权利要求7所述的特征建筑目标检测系统,其特征在于,所述预处理模块具体执行如下步骤:
将每个图像对应标注一个标签文件,标签文件的内容包括:图片长、宽、通道数以及待检测目标在图像中的坐标位置;
对图像进行补全、平移、旋转变换、放射变化和增加通道噪声,获得扩充后的数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京电子工程总体研究所,未经北京电子工程总体研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811417116.X/1.html,转载请声明来源钻瓜专利网。





