[发明专利]一种图像特征金字塔的自适应加权融合方法在审
申请号: | 202010159455.3 | 申请日: | 2020-03-09 |
公开(公告)号: | CN111507359A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 姜明;何利飞;张旻;李鹏飞;汤景凡 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 特征 金字塔 自适应 加权 融合 方法 | ||
本发明公开了一种图像特征金字塔的自适应加权融合方法。本发明步骤:1.首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型;2.将二次训练用的训练集数据输入预训练神经网络模型;3.针对训练集中的目标检测任务,重复步骤4‑8继续训练神经网络模型,直至网络能够准确的检测训练集中的图片;4.使用步骤(1)预训练后的神经网络模型提取图片的特征图;5.把获得的特征图按分辨率建立特征图金字塔模型;6.计算每一层特征图在整个金字塔模型中的重要程度;7.根据特征图在金字塔模型中的重要程度,对每一层特征图分配不同的权重;8.对特征图按照所分配的权重进行融合,然后进行检测。本发明提高目标定位和分类的准确性。
技术领域
本发明设计特征融合方法,具体来讲是一种图像特征金字塔的自适应加权融合方法,属于计算机视觉图像处理技术领域
背景技术
目标检测作为计算机视觉的基本问题之一,是许多其他计算机视觉任务的基础,如实例分割、图像字幕、对象跟踪等。从应用程序的角度来看,目标检测可以被分为两个研究主题“通用目标检测”和“特定目标检测”,前者旨在探索在统一的框架下检测不同类型物体的方法,以模拟人类的视觉和认知;后者是指特定应用场景下的检测,如行人检测、人脸检测、文本检测等。近年来,随着深度学习技术的快速发展,为目标检测注入了新的血液,取得了显著的突破,将其推向了一个前所未有的研究热点。目前,目标检测已广泛应用于自主驾驶、机器人视觉、视频监控等领域。
发明内容
本发明主要是为了处理同一图像中多种尺度的目标而提出来的一种图像特征金字塔的自适应加权融合方法。
为实现以上的技术目的,本发明将采用以下的技术方案:
步骤(1)首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型,数据库ImageNet包含超过1400万张图像,涵盖20000个类别;
步骤(2)将二次训练用的训练集数据输入预训练神经网络模型;
步骤(3)针对训练集中的目标检测任务,重复步骤(4)到(8)继续训练神经网络模型,直至网络能够准确的检测训练集中的图片;
步骤(4)使用步骤(1)预训练后的神经网络模型提取图片的特征图;
步骤(5)把获得的特征图按分辨率建立特征图金字塔模型;
步骤(6)计算每一层特征图在整个金字塔模型中的重要程度;
步骤(7)根据特征图在金字塔模型中的重要程度,对每一层特征图分配不同的权重;
步骤(8)对特征图按照所分配的权重进行融合,然后进行检测。
进一步的,所述的神经网络模型采用的是深度残差网络ResnetNet-101,具体实现如下:
2-1.深度残差网络ResnetNet-101是通过给非线性的卷积层增加直连边的方式来提高信息的传播效率。深度残差网络ResnetNet-101包含4组残差块,共101层卷积层。
2-2.深度残差网络ResnetNet-101中卷积计算使用卷积公式:
其中kernel_size表示使用的卷积核大小,pad表示边缘填充位数,stride表示卷积核每次移动位数。深度残差网络ResnetNet-101中使用kernel_size=3,pad=1,stride=2,根据公式可知conv层不会改变图片大小;
2-3.每个卷积层后的激活(relu)层负责将前一个卷积层的输出映射到后一个卷积层的输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010159455.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序