[发明专利]一种基于特征金字塔的小频标检测方法有效
申请号: | 201911151756.5 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110956108B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 刘桂雄;蒋晨杰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陈新胜 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 金字塔 小频标 检测 方法 | ||
本发明公开了一种基于特征金字塔的小频标检测方法,该方法包括:为所有用于检测的视频添加频标,并从每个视频中每隔n帧提取一张图像制作构成数据集;选择ResNeXt作为骨干网络提取浅层特征、设计深层特征提取网络结构、结合anchor机制,来构建检测频标的目标检测网络,利用FPN将深层语义信息向低层传递以检测小目标;设计损失函数,多次调整超参数并训练得到对应模型,从多次训练模型中选择最佳的目标检测模型;部署目标检测网络,检测出对应目标,根据所检测目标设计频标识别与校验方法。
技术领域
本发明涉及目标检测领域,尤其涉及一种基于特征金字塔的小频标检测方法。
背景技术
视频在传输过程中会因网络状况、信道质量、缓存等种种原因产生接收端画面冻结与画面延迟,画面冻结会影响用户观看视频的体验,而在特定场景如实时视频通话中,画面延迟也需要尽量避免,所以对于视频传输中画面冻结、画面延迟的时域检测就显得很重要。现有的视频传输质量检测很多都是基于对图像质量来评价视频传输质量,而视频传输质量时域检测方面的技术研究多集中在丢包、丢帧与图像失真的联系,以及利用时域图像上下文判断画面冻结。前者无法完全体现视频传输在时域方面的画面冻结与画面延迟性能;而后者难以计算画面冻结时间与画面延迟时间。对此,可为视频每帧添加上频标定位视频帧的位置,通过检测发送端与接收端视频帧上的频标来解决上述问题,由于在视频上添加的频标过大会影响其他方面的检测,为此寻找一种能高效、准确、智能地检测视频帧小频标的方法具有重要现实意义。
发明内容
为解决上述技术问题,本发明的目的是提供一种基于特征金字塔的小频标检测方法。
本发明的目的通过以下的技术方案来实现:
一种基于特征金字塔的小频标检测方法,包括:
A为所有用于检测的视频添加频标,并从每个视频中每隔n帧提取一张图像制作构成数据集;
B选择ResNeXt作为骨干网络提取浅层特征、设计深层特征提取网络结构、结合anchor机制,来构建检测频标的目标检测网络,利用FPN将深层语义信息向上层传递以检测小目标;
C设计损失函数,多次调整超参数并训练得到对应模型,从多次训练模型中选择最佳的目标检测模型;
D部署目标检测网络,检测出对应目标,根据所检测目标设计频标识别与校验方法。
与现有技术相比,本发明的有益效果:
能实时准确地检测出不同大小的目标,适用于检测视频中小频标。
附图说明
图1是基于特征金字塔的小频标检测方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1所示,一种基于特征金字塔的小频标检测方法流程,包括以下步骤:
步骤10为所有用于检测的视频添加频标,并从每个视频中每隔n帧提取一张图像制作构成数据集;
步骤20选择ResNeXt作为骨干网络提取浅层特征、设计深层特征提取网络结构、结合anchor机制,来构建检测频标的目标检测网络,利用FPN将深层语义信息向低层传递以检测小目标;
步骤30设计损失函数,多次调整超参数并训练得到对应模型,从多次训练模型中选择最佳的目标检测模型;
步骤40部署目标检测网络,检测出对应目标,根据所检测目标设计频标识别与校验方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911151756.5/2.html,转载请声明来源钻瓜专利网。