[发明专利]一种基于注意力机制的人脸检测神经网络的构建方法有效
| 申请号: | 202010115987.7 | 申请日: | 2020-02-25 |
| 公开(公告)号: | CN111325161B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 韩强;闫超 | 申请(专利权)人: | 四川翼飞视科技有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 成都佳划信知识产权代理有限公司 51266 | 代理人: | 史姣姣 |
| 地址: | 610000 四川省成都市高新*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 检测 神经网络 构建 方法 | ||
1.一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,包括以下步骤:
采用卷积层和激活层组成注意力模块,利用注意力模块计算求得attention map注意力图;
从前至后按卷积层、批归一化层、激活层和注意力模块的顺序封装得到网络单块;
利用并行的卷积层和与其中之一的卷积层连接的激活层组成回归模块;
将数个网络单块依次连接,并将最后一层的网络单块和倒数第二层的网络单块的输出一一对应介入两个并行的回归模块;
将所述两个并行的回归模块的输出与坐标换算和非极大抑制模块连接,得到人脸检测神经网络。
2.根据权利要求1所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述注意力模块的输出结果计算如下:
利用注意力模块的特征输入张量,计算获得一个与特征输入张量大小相同、且通道为1的一个attentionmap注意力图;
利用attention map注意力图的结果与特征输入张量的相乘,得到注意力模块的输出结果;
所述注意力模块的输出结果的表达式为:
其中,X为注意力模块的输入,X′为注意力模块的输出,为元素乘操作,Fat为注意力映射函数,其函数输出为一个与输入张量大小相同、通道为1的一个attention map注意力图。
3.根据权利要求2所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述注意力模块中attention map注意力图的生成方式为,采用两个连续的卷积层,并且在第二个卷积层后封装采用sigmoid函数的激活层;即公式1中的Fat函数由以下公式给出:
Fat(X)=sigmoid(Conv1(Conv2(X))).................................(2)
其中,sigmoid为sigmoid激活函数,Conv1和Conv2分别为两个卷积操作函数。
4.根据权利要求3所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述两个连续的卷积层的第一个卷积层,即Conv1函数,其卷积核大小为1x1,卷积核数为1;所述两个连续的卷积层的第二卷积层,即Conv2函数,其卷积核大小为3x3、5x5、7x7其中之一,卷积核数为1。
5.根据权利要求1所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述回归模块包括分类结果的卷积层和坐标结果的卷积层,以及与分类结果的卷积层连接的激活层;所述激活层采用sigmoid函数。
6.根据权利要求1所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述网络单块的激活层采用Leaky-Relu激活函数,且Leaky-Relu激活函数的阿尔法值为0.2。
7.根据权利要求1所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述网络单块的数量为8。
8.根据权利要求7所述的一种基于注意力机制的人脸检测神经网络的构建方法,其特征在于,所述依次连接8层网络单块的前5层和最后一层网络单块的卷积层的卷积步长为2;且依次连接8层网络单块的第六层网络单块和第七层网络单块的卷积层的卷积步长为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川翼飞视科技有限公司,未经四川翼飞视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010115987.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种发射功率的调整方法及电子设备
- 下一篇:图像噪声去除方法及装置





