[发明专利]一种图像帧中目标尺度与区域估计的方法有效
申请号: | 201810941383.0 | 申请日: | 2018-08-17 |
公开(公告)号: | CN109117886B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 尚凌辉;张兆生;王弘玥;丁连涛 | 申请(专利权)人: | 浙江捷尚视觉科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06N3/08;G06T3/40;G06T5/00;G06T7/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 目标 尺度 区域 估计 方法 | ||
1.一种图像帧中目标尺度与区域估计的方法,其特征在于该方法包括以下步骤:
步骤一、离线训练
1.1将原始图像做随机裁剪和水平翻转,缩放为固定尺寸;
1.2生成大尺度目标标签:
大尺度目标定义为尺度属于[n1,n2]的目标;根据缩放图像上的目标宽高的均值计算大尺度分数向量;对于一个区间,如果存在属于这个尺度区间的目标,分数向量上对应的分数置为1,为正样本;如果不存在属于这个尺度区间的目标,分数向量上对应的分数置为0,为负样本;
1.3生成小尺度目标标签:
小尺度目标定义为尺度属于[m1,m2]的目标;将图像划分成L个大小为a、步长为s的区域;对于单个区域,根据区域内目标宽高的均值计算小尺度分数向量;正负样本计算规则与大尺度目标相同;
1.4使用caffe训练目标尺度分类器;
步骤二、在线检测
2.1、将图像缩放,输入训练好的目标尺度分类器,得到尺度估计的分布分数;
2.2、大尺度目标估计:
2.2.1、对大尺度估计的分布分数做平滑;
2.2.2、对大尺度估计的分布分数做非极大值抑制,得到全图是否有大尺度目标,如果有大尺度目标,得到大尺度目标的尺度;
2.3、小尺度目标尺度与区域估计:
2.3.1、对一个区域的小尺度估计分数做平滑;
2.3.2、对区域的小尺度估计的分布分数做非极大值抑制,得到该区域图是否有小尺度目标,如果有小尺度目标,得到小尺度目标的尺度;
2.3.3、对其它区域做2.3.1和2.3.2相同的操作;
2.4、输出图像帧的尺度和区域估计结果。
2.根据权利要求1所述的一种图像帧中目标尺度与区域估计的方法,其特征在于:在模型训练优化过程中的损失函数使用两个加权的交叉熵损失函数:
Loss表示损失,m'表示尺度序号,wm'表示第m'个尺度区间的权重,pm'表示第m'个尺度区间的分数,表示第m'个尺度区间的估计结果,(l,n')表示第l个图像区域的第n'个尺度区间的参数,α是一个权重比例调节参数,表示大尺度目标和小尺度目标对Loss的影响。
3.根据权利要求1或2所述的一种图像帧中目标尺度与区域估计的方法,其特征在于:使用caffe训练目标尺度分类器所使用的训练策略为:先训练一个不做区域估计的、全图的全尺度估计模型,用这个模型初始化尺度与区域估计模型,再进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技股份有限公司,未经浙江捷尚视觉科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810941383.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序