[发明专利]基于改进FasterR-CNN的岩画检测方法有效
申请号: | 202110795038.2 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113537045B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 李春树;路梦瑶;贾大勇;刘煜;姜文超 | 申请(专利权)人: | 宁夏大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06V30/413;G06N3/04;G06T3/40 |
代理公司: | 银川瑞海陈知识产权代理事务所(普通合伙) 64104 | 代理人: | 贠天娥 |
地址: | 750000 宁夏回*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 fasterr cnn 岩画 检测 方法 | ||
1.一种基于改进Faster R-CNN的岩画检测方法,其特征在于:基于改进Faster R-CNN的岩画检测方法包括以下步骤:
步骤一,制作岩画数据集,采集岩画信息,并将岩画信息按照岩画的物种对岩画进行分类保存;
步骤二,数据集的采集与增强;
步骤三,利用空间金字塔池化;
步骤四,建立金字塔卷积模块;
步骤五,设计RoIAlign构造基于改进Faster R-CNN目标检测算法,通过空间金字塔池化,提取出岩画图像的多尺度特征,金字塔卷积模块利用不同类型的核进行信息互补,将原来的RoI Pooling替换成RoIAlign,构造出基于改进Faster R-CNN目标检测算法;
步骤一中,使用摄影设备寻找相关岩画信息并进行实地拍摄,并且在拍摄过程中,注意拍摄位置的光照,避免其他物体的遮挡,确保相机的准确对焦,调整拍摄距离的远近和拍摄角度,通过对岩画的图像进行提取;通过搜索引擎搜索相关图像并对其进行保存;对图像的数据进行筛除,之后对图像进行人工分类,按照物种进行分类并命名;
步骤二中,使用深度神经网络对岩画数据集进行训练,在训练阶段利用在线数据增强技术对训练集中的图像进行处理,生成等价的数据;
步骤二中具体使用的增强方法为:调整图像大小、翻转、归一化和填充;
步骤一中,岩画数据集按照VOC2007数据格式进行制作,首先,通过运行Python代码将获取到的图像全部转换为JPG格式的图像,并按照VOC2007数据集的图像命名要求进行统一批量重命名,之后创建名为JPEGImages的文件夹,将统一命名好的JPG格式的岩画图像全部放入;其次,创建名为Annotations的文件夹,该文件夹下存放标注岩画图像生成的XML文档,该文档包含了图像及图像中目标的相关信息,然后创建名为ImageSets的文件夹,并在该文件夹下新建Main文件夹,该文件夹下存放数据集按比例划分后的训练验证集、测试集、训练集和验证集的相关txt文档;采用LabelImg图像标注软件对岩画进行标注,用sheep、monkey_face、sun_spirit和human_face分别表示羊像、猴面像、太阳神像和人面像,标注完后岩画图像及图中目标的信息以XML文件格式进行保存,将产生的XML文件通过相应的代码按比例随机分配,其中训练集占整体数据集的十分之九,测试集占整体数据集的十分之一,之后再将训练验证集按照一定比例随机分配,其中训练集占训练验证集的五分之四,验证集占训练验证集的五分之一;
步骤三中,首先通过ResNet101对输入岩画图像进行处理,生成特征图,在ResNet101的卷积组的一层的输出后加入空间金字塔池化结构,对岩画图像的多尺度特征进行提取,池化操作输出大小计算公式:
式一中,Wi和Hi分别为输入的宽和高,池化核的大小记为f×f,S为步长大小,Wo和Ho分别为输出的宽和高,在上述公式中加入填充操作,并对步长的计算公式进行修正:
之后利用带有填充的池化操作输出大小计算公式:
式二中(PW,Ph)为填充padding,sizew为空间金字塔池化核的宽度大小,sizeh为空间金字塔池化核的长度大小,式三中,stridew为步长宽度大小,strideh为步长长度大小,式二和式三中的w、h分别为空间金字塔的宽度和长度,n为图像输出的宽度和长度,核的大小设置为3、5、7三种尺度,池化操作的步长设置为1并进行填充操作,之后将池化后的特征与原始特征进行合并;
步骤四中,在FPN后增加金字塔卷积模块,金字塔卷积从底部到顶部共两层,每层的输入为256,输出为128;第一层卷积核的空间大小为3×3,第二层卷积核的空间大小为5×5;每层使用了相同深度的卷积,其组数都设置了分组数64,即输入特征图被分成64组,每组独立的应用卷积进行计算,步长采用相同的大小,默认设置为1,第一层和第二层填充的大小分别设置为1和2;
将原来的RoIPooling替换成RoIAlign,其将取整操作替换成双线性插值,将RoI取得的特征和原图对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁夏大学,未经宁夏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110795038.2/1.html,转载请声明来源钻瓜专利网。