[发明专利]用于目标检测的方法和装置在审
申请号: | 201810068724.8 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108470138A | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 李威;陈杰 | 申请(专利权)人: | 博云视觉(北京)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 孟潭 |
地址: | 100095 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据集 训练模型 子集 待测图像 目标识别 检测 卷积神经网络 目标检测 样本图像 正整数 方法和装置 关联 输出 | ||
本发明提供了一种用于目标检测的方法,包括:基于第一训练数据集,利用卷积神经网络进行初步训练,以获得第一训练模型,其中,第一训练数据集用于指示分别具有检测目标的M个样本图像,M为正整数;利用第一训练模型识别出N个待测图像中的K个待测图像中具有检测目标,并且输出与K个待测图像分别对应的K个检测目标识别结果,N和K为正整数;基于第二训练数据集,利用卷积神经网络对第一训练模型进行重新训练,以获得第二训练模型,其中,第二训练数据集包括第一子集,第二训练数据集还包括第一训练数据集和第二子集中的一项,第一子集与K个检测目标识别结果中错误的检测目标识别结果相关联,第二子集与M个样本图像中的背景相关联。
技术领域
本发明涉及机器学习领域,尤其涉及一种用于目标检测的方法和装置。
背景技术
随着电力建设的飞速发展,输电网络规模的不断的扩大,在复杂地形条件下建设的输电线路越来越多,输电线路具有分散性大且难以监控和维护等特点,为输电线路因大型作业目标导致故障的监控埋下了巨大的隐患。
目前,电力部门通过在相关地区安装监控摄像头并采用人力监控的方式对输电线路附近的大型作业目标进行监控。然而,这种方式存在投入大、耗费精力多、易错率高等缺点。
为了解决人力监控的问题,提出了一些其它技术,例如,常见的基于视频的处理技术。在这种技术中,对每两帧图像进行背景差分,生成差分图像。若差分图像中存在异常目标,确定异常目标在差分图像中的区域面积,并判断区域面积是否大于预设阈值。若区域面积大于预设阈值,确定当前有大型作业目标入侵输电线路并找到相对应的目标位置。
然而,这种方式在确定目标的精度、效率及可泛化性上还存在较大问题,有很大的局限性。
发明内容
本发明针对上述问题,提供了一种用于目标检测的方法和装置。
第一方面,提供了一种用于目标检测的方法,包括:基于第一训练数据集,利用卷积神经网络进行初步训练,以获得第一训练模型,其中,第一训练数据集用于指示分别具有检测目标的M个样本图像,M为正整数;利用第一训练模型识别出N个待测图像中的K个待测图像中具有检测目标,并且输出与K个待测图像分别对应的K个检测目标识别结果,N和K为正整数;基于第二训练数据集,利用卷积神经网络对第一训练模型进行重新训练,以获得第二训练模型,其中,第二训练数据集包括第一子集,第二训练数据集还包括第一训练数据集和第二子集中的一项,第一子集与K个检测目标识别结果中错误的检测目标识别结果相关联,第二子集与M个样本图像中的背景相关联。
在第一种可能实现的方式中,K个检测目标识别结果中的第j个检测目标识别结果包括用于标识K个待测图像的第j个待测图像中的检测目标的检测框以及检测目标类别信息,j为正整数,j小于或者等于K;错误的检测目标识别结果包括检测框位置错误或者检测目标类别信息错误的结果;第一子集包括错误的检测目标识别结果中的检测框内的图像数据。
结合第一方面或第一方面的第一种可能实现的方式,在第二种可能实现的方式中,上述基于第一训练数据集,利用卷积神经网络进行初步训练,以获得第一训练模型,包括:利用卷积神经网络对M个样本图像中的第i个样本图像进行以下处理,直到处理完M个样本图像为止,其中i为正整数,i小于或者等于M:提取第i个样本图像中的图像特征;基于第i个样本图像中的图像特征,在第i个样本图像中生成多个候选框;基于多个候选框与第i个样本图像中的检测目标之间的重叠率,将多个候选框划分为第一组候选框和第二组候选框,第一组候选框用于表示i样本图像中的检测目标,第二组候选框用于表示第i个样本图像中的背景;利用卷积神经网络,基于M个样本图像中每个样本图像的第一组候选框以及每个样本图像中的检测目标,获得第一训练模型;其中,第二子集包括在每个样本图像中的第二组候选框内的图像数据。
结合第一方面的第二种可能实现的方式,在第三种可能实现的方式中,第一组候选框与检测目标之间的重叠率大于或者等于预设的阈值,第二组候选框与检测目标之间的重叠率小于预设的阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博云视觉(北京)科技有限公司,未经博云视觉(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068724.8/2.html,转载请声明来源钻瓜专利网。