[发明专利]一种基于混合监督检测的目标传输方法在审
申请号: | 201810520073.1 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108830300A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标记图像 干扰物 检测 目标传输 边界框 分类器 注释框 对象感知 对象检测 实例学习 训练目标 不变性 学习域 有效地 预测器 传输 监督 学习 失败 | ||
1.一种基于混合监督检测的目标传输方法,其特征在于,主要包括域不变目标的学习(一);对象感知检测模型(二)。
2.基于权利要求书1所述的域不变目标的学习(一),其特征在于,用基于卷积神经网络(CNN)的方法对目标知识进行建模,并且目标知识模型直接用选择性搜索生成的自下而上的训练方案进行训练。
3.基于权利要求书2所述的目标知识,其特征在于,利用强类别中的边界框注释,目标知识的学习作为一个二进制分类任务进行:把与参考标签框有很大重叠的区域视为对象,而重叠较小的区域视为非对象。
4.基于权利要求书2所述的训练方案,其特征在于,在训练时,图像和一组区域建议输入给多个卷积层、感兴趣区域(RoI)池层和全连接(fc)层,每个区域ri最终被映射到一个256维矢量作为输入区域的内部表示,然后fi连接到目标预测器和域分类器两个分支。
5.基于权利要求书4所述的目标预测器,其特征在于,表示为Gobj,由fc层组成,根据fi预测区域ri是否是一个对象,由于在图像中需要用边界框注释将对象区域和非对象区域分隔开,所以只使用集合中的区域来训练目标预测器,其二元逻辑损失如下:
其中是区域ri属于对象的后验概率;与参考标签相交的区域(IoU)不小于0.5的区域被认为是正面例子,最大的IoU在区间[0.1,0.5)中的区域为反面例子;将每个图像中正反例子按1:3的比例保持平衡,因为负面例子的数量远远大于正面例子的数量;然后在集合上训练目标预测器分支,同时为了使在集合中学习的目标能很好地应用到集合上,将目标学习作为一个领域适应问题,把集合和分别视为源域和目标域。
6.基于权利要求书4所述的域分类器,其特征在于,表示为Gdom,通过连接域分类器和特性f可以实现域不变性;域分类器接收来自集合和集合的区域,预测输入区域的来源,它是一个二进制分类任务,使用的优化函数为:
其中是区域ri属于集合的概率,在这个域分类任务中,从集合中采样的区域是正面例子,从集合中取样的区域是反面例子;
在前向传播过程中,域分类器按标准执行程序,计算得到Ldom,在反向传播过程中,域分类器的梯度先被反向(乘以-1)再传递给f,通过这个梯度反转算子,在训练过程中,网络实际上最大化了Ldom;在每个训练迭代中,抽取集合中的64个随机的未标记区域、集合中的64个平衡区域和64个随机区域,用于训练域分类器,因此每个训练小分支都包含192个区域。
7.基于权利要求书1所述的对象感知检测模型(二),其特征在于,将目标检测器学习到的目标知识用于分离集合中弱标记图像的对象和干扰物,接着对于每个弱标记图像,它的区域建议先被输入到目标模型中,以得到它们的目标得分,然后根据分数进行排序,分数最高的m%的建议被选为对象区域,剩下的区域作为干扰区域;然后基于多实例学习(MIL)方法进一步对对象和干扰物之间的差异建模,最后采用快速的基于区域的卷积网络方法(R-CNN)框架对对象感知检测模型进行训练。
8.基于权利要求书6所述的建模,其特征在于,在MIL框架中,对于集合中的每一个弱标记图像,用对象区域构造对象数据包,用干扰区域构造干扰物数据包,这两种数据包的标签为其中干扰包被标记为而对象包被标记为相应的对象类
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810520073.1/1.html,转载请声明来源钻瓜专利网。