[发明专利]一种基于层次回归的轻量级图像探测农业驱鸟方法及系统有效
申请号: | 202010804741.0 | 申请日: | 2020-08-12 |
公开(公告)号: | CN112115970B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 周同;余振滔 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/08;A01M29/16 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 封睿 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 回归 轻量级 图像 探测 农业 方法 系统 | ||
1.一种基于层次回归的轻量级图像探测农业驱鸟方法,其特征在于,包括以下步骤:
步骤1,建立基于卷积神经网络的层级回归目标检测模型ScareDet,利用梯度下降算法在鸟类数据集上进行训练,并将训练好的模型存入树莓派中;
步骤2,利用可变焦相机拍摄指定区域图像,并通过USB接口将图像数据传送到树莓派中;
步骤3,利用树莓派存储的ScareDet检测模型和图像数据进行鸟类检测;
步骤4,根据树莓派检测结果控制扬声器供电,如果检测存在鸟类,则给扬声器供电,由扬声器发出报警噪音驱赶鸟类,否则返回步骤2继续进行监测;
步骤1中,建立的基于卷积神经网络的层级回归目标检测模型ScareDet的检测过程为:
步骤11:利用卷积神经网络对图像进行特征提取并进行1次下采样,得到图像特征图C1,接着对C1继续下采样3次得到C2,C3,C4,然后在这四个不同尺度的特征图{C1,C2,C3,C4}上分别利用固定大小和长宽比的锚框进行图像区域提取,并利用前景背景二分类焦点损失函数对锚框进行分类筛选和回归损失函数Smooth L1对锚框尺寸和坐标进行修正,得到一系列位置更加精确的预选框;
步骤12:对步骤11的四个特征图{C1,C2,C3,C4}作两组3×3的卷积,进一步抽象化图像特征,得到特征图{C1',C2',C3',C4'}并按照从左至右的顺序,把每个特征图依次加在其后面的每个特征图上,实现图像细节特征和语义特征的互补与融合,最后得到新的四个特征图{P1',P2',P3',P4'};
步骤13:首先对步骤12输出的特征图{P1',P2',P3',P4'}作一组3×3的卷积,得到特征图{P11',P22',P33',P44'},然后对{P11',P22',P33',P44'}中的每个特征图进行全局平均池化、全连接层连接、ReLU激活函数非线性化、全连接层连接和Sigmoid激活函数权重值预测,得到第一权重值w1,对{P11',P22',P33',P44'}中的每个特征图进行全局最大池化、全连接层连接、ReLU激活函数非线性化、全连接层连接和Sigmoid激活函数权重值预测,得到第二权重值w2,接着对这两部分权重值进行相加平均得到最终的权重值,最后将{P11',P22',P33',P44'}每个特征图得到的权重值分别与{P11',P22',P33',P44'}对应的特征图相乘,输出第二阶段的特征图{P1,P2,P3,P4};
步骤14:根据第二阶段的特征图{P1,P2,P3,P4}和步骤11修正后的预选框,结合焦点损失分类函数和Smooth L1回归损失函数进行预选框区域所属分类和坐标回归训练,进一步优化识别和检测准确度;
步骤2中,还包括数据标准化的过程,具体方法为:
树莓派读取内部时钟时间,在7:00-18:00时间内的图像,利用OpenCV库中imread函数对图像进行读取,并利用resize函数对图像缩放到256*256存储到内存中;在18:00-7:00时间内的图像,在resize之前利用addWeighted函数调整图像的亮度和曝光度;
步骤3中,树莓派利用存储的ScareDet检测模型和图像数据进行鸟类检测,如果图片中存在鸟类,模型会输出鸟类的坐标和类别标签“1”,同时树莓派内部会置高一个标志位代表检测到了鸟类,否则标志位置低,代表没有检测到鸟类;
步骤4中,根据树莓派的标志位控制扬声器供电,若标志位为高,则控制扬声器通电进行报警干扰,驱除鸟类,否则不做任何处理,返回步骤2继续进行监测。
2.一种基于层次回归的轻量级图像探测农业驱鸟系统,其特征在于,包括:
模型训练模块,用于建立基于卷积神经网络的层级回归目标检测模型ScareDet,利用梯度下降算法在鸟类数据集上进行训练,并将训练好的模型存入树莓派中;
图像采集模块,用于利用可变焦相机拍摄指定区域图像,并通过USB接口将图像数据传送到树莓派中;
鸟类检测模块,用于利用树莓派存储的ScareDet检测模型和图像数据进行鸟类检测;
驱鸟模块,用于根据树莓派检测结果控制扬声器供电,如果检测存在鸟类,则给扬声器供电,由扬声器发出报警噪音驱赶鸟类,否则由图像采集模块和鸟类检测模块继续监测;
所述模型训练模块中,基于卷积神经网络的层级回归目标检测模型ScareDet的检测过程为:
步骤11:利用卷积神经网络对图像进行特征提取并进行1次下采样,得到图像特征图C1,接着对C1继续下采样3次得到C2,C3,C4,然后在这四个不同尺度的特征图{C1,C2,C3,C4}上分别利用固定大小和长宽比的锚框进行图像区域提取,并利用前景背景二分类焦点损失函数对锚框进行分类筛选和回归损失函数Smooth L1对锚框尺寸和坐标进行修正,得到一系列位置更加精确的预选框;
步骤12:对步骤11的四个特征图{C1,C2,C3,C4}作两组3×3的卷积,进一步抽象化图像特征,得到特征图{C1',C2',C3',C4'}并按照从左至右的顺序,把每个特征图依次加在其后面的每个特征图上,实现图像细节特征和语义特征的互补与融合,最后得到新的四个特征图{P1',P2',P3',P4'};
步骤13:首先对步骤12输出的特征图{P1',P2',P3',P4'}作一组3×3的卷积,得到特征图{P11',P22',P33',P44'},然后对{P11',P22',P33',P44'}中的每个特征图进行全局平均池化、全连接层连接、ReLU激活函数非线性化、全连接层连接和Sigmoid激活函数权重值预测,得到第一权重值w1,对{P11',P22',P33',P44'}中的每个特征图进行全局最大池化、全连接层连接、ReLU激活函数非线性化、全连接层连接和Sigmoid激活函数权重值预测,得到第二权重值w2,接着对这两部分权重值进行相加平均得到最终的权重值,最后将{P11',P22',P33',P44'}每个特征图得到的权重值分别与{P11',P22',P33',P44'}对应的特征图相乘,输出第二阶段的特征图{P1,P2,P3,P4};
步骤14:根据第二阶段的特征图{P1,P2,P3,P4}和步骤11修正后的预选框,结合焦点损失分类函数和Smooth L1回归损失函数进行预选框区域所属分类和坐标回归训练,进一步优化识别和检测准确度;
所述图像采集模块中,还进行数据标准化操作,具体方法为:
树莓派读取内部时钟时间,在7:00-18:00时间内的图像,利用OpenCV库中imread函数对图像进行读取,并利用resize函数对图像缩放到256*256存储到内存中;在18:00-7:00时间内的图像,在resize之前利用addWeighted函数调整图像的亮度和曝光度;
所述鸟类检测模块中,树莓派利用存储的ScareDet检测模型和图像数据进行鸟类检测,如果图片中存在鸟类,模型会输出鸟类的坐标和类别标签“1”,同时树莓派内部会置高一个标志位代表检测到了鸟类,否则标志位置低,代表没有检测到鸟类;
所述驱鸟模块中,根据树莓派的标志位控制扬声器供电,若标志位为高,则控制扬声器通电进行报警干扰,驱除鸟类,否则不做任何处理,由图像采集模块和鸟类检测模块继续监测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010804741.0/1.html,转载请声明来源钻瓜专利网。