[发明专利]输入为具有去重预处理的密集查询的端到端检测器在审
申请号: | 202210232221.6 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114708424A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 张士龙;王新江;王佳琦;庞江淼;陈恺 | 申请(专利权)人: | 上海人工智能创新中心 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏;成丹 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 输入 具有 预处理 密集 查询 端到端 检测器 | ||
1.一种输入为具有去重预处理的密集查询的端到端检测器,包括区域建议网络和解码器,其中,所述区域建议网络针对输入图像生成第一查询,该第一查询包含对应的建议框和对应的查询编码;所述解码器在每个一对一正样本检测头前对输入的第一查询进行去重处理并提高区分度,进而生成预测的区域框和对应的查询编码。
2.根据权利要求1所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述区域建议网络包括共享分支、分类子分支和回归子分支,共享分支用于提取输入图像的特征,分类子分支用于基于提取的特征识别目标类别,回归子分支用于对待识别目标生成多个建议框,其中所述查询编码是将分类子分支与回归子分支特征图对应的特征点混合起来形成,该查询编码与回归头对应的建议框形成所述第一查询。
3.根据权利要求1所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述区域建议网络基于中心先验正负样本匹配进行训练,匹配过程包括:将标注框的中心点映射到特征图金子塔上,以特征金子塔上每层的映射点作为参考选取最近邻的若干点作为潜在正样本,并将所有潜在正样本与所有标注进行匈牙利匹配,为每个标注选择唯一的正样本。
4.根据权利要求3所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述解码器在每个一对一正样本检测头前对输入的第一查询进行去重处理并提高区分度包括:
基于设定的交并比阈值对第一查询中包含的建议框执行非极大值抑制,获得第二建议框和对应的查询编码;
使用第二建议框进行多层区域池化,得到池化特征;
利用池化特征与查询编码进行融合,进行一次前更新;
利用前更新后的查询编码生成参数,与池化特征进行卷积,并经过分类回归得到新的建议框与更新后的查询编码,作为所述预测的区域框和对应的查询编码。
5.根据权利要求4所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述多层区域池化是在原区域池化层的上下层均分别进行区域池化,并各自通过一个卷积进行映射后相加。
6.根据权利要求1所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,对于所述解码器输出的预测的区域框和对应的查询编码,在最后检测头上,以预测区域框的交并比作为分类头的预测目标。
7.根据权利要求1所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述区域建议网络依次连接多个所述解码器。
8.根据权利要求2所述的输入为具有去重预处理的密集查询的端到端检测器,其特征在于,所述共享分支包含三层卷积,所述分类子分支和所述回归子分支各包含一层卷积。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至8中任一项所述的输入为具有去重预处理的密集查询的端到端检测器中的区域建议网络和解码器。
10.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8中任一项所述的输入为具有去重预处理的密集查询的端到端检测器中的区域建议网络和解码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海人工智能创新中心,未经上海人工智能创新中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210232221.6/1.html,转载请声明来源钻瓜专利网。