[发明专利]基于级联注意力与点监督机制的全卷积考场目标检测方法有效
申请号: | 202010672308.6 | 申请日: | 2020-07-14 |
公开(公告)号: | CN111814704B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 马苗;田卓钰;郭敏;任杰 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 级联 注意力 监督机制 卷积 考场 目标 检测 方法 | ||
一种基于级联注意力与点监督机制的全卷积考场目标检测方法,由构建全卷积考场目标检测网络模型、训练全卷积考场目标检测网络模型、检测测试集图像组成。本发明在FCOS方法的基础上,提出了级联注意力模块,插入骨干网络与特征金字塔网络之间,使特征金字塔网络获得显著的特征;在全卷积检测头部模块增加了点监督分支,使检测模型具有区分交叠目标能力,能在考生座位密集的考场监控场景下检测交叠目标,解决了密集场景下目标检测包围框回归不准确的问题。本发明精度为92.9%,检测速度为22.1帧/秒,提高了考场目标检测任务的精度与速度,可用于考场检测。
技术领域
本发明属于教育科学和图像处理的交叉研究技术领域,具体地涉及到标准化考场中的考生目标检测。
背景技术
考试是考核学习者知识水平和能力的主要途径。为了规范考场秩序、防范考生作弊行为,维护考试的公平和公正,我国目前主要采用现场考官巡查与电子视频监控相结合的方式进行监考。由于考场监控视频的数据量庞大、冗余信息过多,传统考场监控系统效率极低,监测人员往往会因劳动强度大而导致视觉疲劳,无法保证对多个考场监控画面进行高效监测,难以发现考生的异常行为。运用先进的计算机视觉技术服务于现行的各类考试,建设智慧考场,实现考生行为的智能化监控,对于减轻监测人员的压力、维护考场秩序和保证考试公平具有重要的现实意义。现有的考场智能化监测技术的研究较少,主要使用传统的图像处理技术监测异常情况,存在着准确率低、计算量大、速度慢等问题,无法满足考场监测的现实需求。
基于深度学习的目标检测技术可大致分为两阶段检测方法与单阶段检测方法两类。两阶段方法通常包括候选区域的生成及分类两个步骤,但其速度往往过慢,难以实际应用。单阶段方法利用卷积神经网络对整幅图像提取特征并直接预测回归目标的类别与位置,提高了目标检测的速度,但检测精度不高。另外目前大多数方法采用基于先验锚框的思想,不仅需要人工设计繁琐的锚框参数,而且当结合多尺度架构时会变得十分复杂。虽然近年来在目标检测领域出现了一些无锚框的目标检测方法,避免了手工设计锚框的步骤,但未考虑针对标准化考场下考生目标分布相对密集且因考生就坐位置与成像设备间的距离导致成像尺寸差异大的情况。
目标检测(FCOS)方法是一种基于全卷积网络的逐像素目标检测方法。该目标检测方法先对输入图片进行特征提取,以特征图中各个像素点为中心进行目标分类与包围框回归,FCOS方法由骨干网络、特征金字塔模块、全卷积检测头部三部分组成。骨干网络通常采用残差网络进行特征提取,将提取得到的一系列特征图输入至特征金字塔模块中进行多尺度特征融合,将不同尺度的特征图输入全卷积检测头部模块进行目标的分类与回归。全卷积检测头部模块包含分类分支和回归分支,其中分类分支包含分类得分图和Center-ness热力图,回归分支包含距离信息图。
考虑到真实考场监控视频中考生目标分布相对密集且因就坐位置与成像设备间的距离导致成像尺寸差异大,FCOS方法难以对其进行精确检测。另外,在FCOS方法中若标注的真实框重叠,位置(x,y)映射到原图中将得到多个真实框,则该位置被认为是模糊样本,重叠的真实框可能会在训练过程中造成难以处理的歧义。在教室监控场景下,目标分布密集,大多数目标会相互遮挡,仅使用FCOS方法中的多级预测和Center-ness方法难以确定检测框的边界,容易造成误判。
发明内容
本发明所要解决的技术问题在于克服现有技术的缺点,提供一种方法能够有效进行考场目标检测的基于级联注意力与点监督机制的全卷积考场目标检测方法。
解决上述技术问题所采用的技术方案是由下述步骤组成:
(1)构建全卷积考场目标检测网络模型
在Pytorch框架下,将基于级联注意力的特征增强模块的特征提取网络输出与采用点监督分支的检测模块连接构成基于级联注意力与点监督机制的全卷积考场目标检测网络模型。
(2)训练全卷积考场目标检测网络模型
(a)设置网络的超级参数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010672308.6/2.html,转载请声明来源钻瓜专利网。