[发明专利]一种基于深度学习的快速区域搜索的目标检测方法在审
申请号: | 201910631921.0 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110414389A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 段智文;郑晓凯 | 申请(专利权)人: | 黑龙江御林湾科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 牟永林 |
地址: | 150006 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标检测 快速区域 测试样本集 训练样本集 搜索 障碍物 列车 学习 列车控制系统 目标检测算法 误差反向传播 光学图像 计算误差 评估网络 前向传播 事故发生 网络参数 网络权 准确率 标注 网络 图像 行驶 保存 分割 检测 | ||
1.一种基于深度学习的快速区域搜索的目标检测方法,其特征在于:所述目标检测算法,其具体的算法过程如下:
步骤一、搭建基于深度学习的快速区域搜索的目标检测网络;
步骤二、获取带有待识别的障碍物目标的图像,并对其进行标注,分割为测试样本集和训练样本集;
步骤三、训练样本集输入到目标检测网络进行前向传播计算,计算误差并将误差反向传播,调整网络权值;
步骤四、利用测试样本集评估网络识别准确率。若不满足要求,则若满足要求,则保存网络参数,训练完成;
步骤五、训练完成后用于检测搜索区域的目标。
2.根据权利要求1所述的一种基于深度学习的快速区域搜索的目标检测方法,其特征在于:所述的步骤一中目标检测网络结构,其目标检测网络结构中前16层为特征提取层,其结构为交替的8个卷积层和8个池化层组成,池化层输出接两个全连接层,全连接层输出连接两个不同的特有任务层,一个为预测类别输出,另一个用于预测位置坐标。
3.根据权利要求2所述的一种基于深度学习的快速区域搜索的目标检测方法,其特征在于:各个卷积层和池化层的主要目的在于对输入的图像进行深度的特征提取和组合,卷积核个数分别为64、128、256、256、256、256、256和128,卷积核尺寸均为3*3,这样可以保证提取到细节丰富的底层特征并对其进行组合,每个卷积层后均连接一个池化层,用于对提取到的特征进行降维,防止参数过多导致的优化困难,池化层尺寸为2*2,步长为2。
4.根据权利要求3所述的一种基于深度学习的快速区域搜索的目标检测方法,其特征在于:全连接层用于对提取到的深度特征进行进一步全局组合,全连接层1的输入神经元有256个,输出神经元个数为200个。全连接层2的输入神经元个数为200个,输出神经元个数为128个;
两个任务特有层为独立结构,均以全连接层2的输出为输入,任务特有层1为一层的全连接层,输入神经元个数为128个,输出神经元个数为待识别的目标类数目,用于预测检测出的目标类型,任务特有层2为一个三层的多层感知机,输入神经元为128个,输出神经元为3个,输出结果为目标起点位置、包围盒长度、包围盒宽度。
5.根据权利要求1所述的一种基于深度学习的快速区域搜索的目标检测方法,其特征在于:所述的步骤三中训练样本集输入到目标检测网络进行前向传播计算,计算误差并将误差反向传播,调整网络权值的具体计算步骤如下:
设训练样本集合为为样本数据集,为第i个训练样本,Ns为训练样本总数,为与Xs对应的类别空间,为第i个训练样本的类别标签,为该样本在图像中的位置,设f(x)为本发明中目标检测网络模型,x代表输入样本,yi表示预测的类别,pi表示预测的类别对应的图像中的位置,根据预测值和真实标签计算损失函数其中为分类损失,为面积预测损失,λ为权重因子用于控制面积预测损失在总体损失函数中的比重,分类损失部分d(·)表示真实标签和分类预测yi之间的差值,其计算方式不唯一,Ω||ω||2为L2正则项,用于防止分类模型过拟合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江御林湾科技有限公司,未经黑龙江御林湾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910631921.0/1.html,转载请声明来源钻瓜专利网。