[发明专利]一种基于机器学习的视频目标检测方法在审
申请号: | 201710985003.9 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107705324A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 胡海峰;张运鸿;孙永丞;张承灏;王焕宇 | 申请(专利权)人: | 中山大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 视频 目标 检测 方法 | ||
1.一种基于机器学习的视频目标检测方法,其特征在于,包括以下步骤:
(1)对于待跟踪的视频,利用SSD目标检测算法得到待跟踪的目标检测框,并在图像上标出bounding-box;对于每一张标记的图片分别利用光流跟踪法和全卷积神经网络独立地进行追踪;
其中光流跟踪法进行追踪的具体过程为:对于给出目标检测框的目标,均匀采集M个点作为跟踪点;根据两帧之间的光流来计算这M个点在下一帧的目标点;当目标点与当前帧中M个点所对应的点的欧氏距离小于设定的阈值则保留下来,作为跟踪点;基于所获得的下一帧中的跟踪点,计算下一帧的目标检测框的位置;
全卷积神经网络独立地进行追踪的具体过程为,采用VGG16模型,13个卷积层,3个全连接层,使用主成分分析法提取其主要特征,分别提取卷积神经网络中的高层和底层特征,选出和当前跟踪目标最相关的特征图管道,分别输入到两个两层卷积的卷积网络SNet和Gnet,得到两个预测的热图,并根据是否有错误选择决定使用哪个热图生成最终的跟踪结果;
(2)对于光流算法检测出的结果,和全卷积神经网络检测的结果,提取其HOG特征,通过SVM将两个结果进行有效性的判断,最终选出跟踪目标的准确位置。
2.根据权利要求1所述的一种基于机器学习的视频目标检测方法,其特征在于,其中提取卷积神经网络中的高层和底层特征具体为:是Conv4-3(第10层)和Conv5-3(第13层),用它们的特征分别构建特征选择网络sel-CNN,选出和当前跟踪目标最相关的特征图管道,对筛选出的Conv5-3和Conv4-3特征分别构建捕捉类别信息的GNet和区分背景相似物体的Snet;
在第一帧中使用给出的bounding-box生成热度图,回归训练sel-CNN,GNet和Snet;对于每一帧,以上一帧预测结果为中心选出一块区域,之后分别输入GNet和SNet,得到两个预测的热图;根据热图计算跟踪错误率,当错误率小于设定的阈值则选择GNet的结果,否则选择SNet的结果。
3.根据权利要求1所述的一种基于机器学习的视频目标检测方法,其特征在于,所述步骤(2)中,对光流算法检测出的结果和全卷神经网络检测的结果,提取其HOG特征,通过SVM将两个结果进行有效性的判断,具体的判断方法:
当光流算法判断为有效,全卷神经网络检测结果判断为无效,则采用光流算法的检测框;
当全卷神经网络检测检测结果有效,光流算法无效,则采用全卷神经网络检测结果;
当光流算法检测和全卷神经网络检测都有效的话,则采用两个检测结果的平均值作为最终结果;
当光流算法检测和全卷神经网络检测都无效的话,则说明追踪失败;
对有效的检测结果,以检测框为中心限定半径为R的圆;在检测框外部,圆的内部随机提取正样本,在圆的外部随机提取负样本,当正样本被SVM判断为负样本则加入到训练集中,当负样本被SVM判断为正样本则加到训练集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710985003.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种栅极驱动电路
- 下一篇:调节色彩参数的方法及系统