[发明专利]一种基于改进Alexnet网络的羊脸识别方法有效
申请号: | 202111019519.0 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113449712B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 谭焓;田芳;周勇;姚娟;章程;姚雅鹃;姚州 | 申请(专利权)人: | 武汉方芯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 徐瑛 |
地址: | 430000 湖北省武汉市洪山区东湖新技术开发区高新*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 alexnet 网络 识别 方法 | ||
1.一种基于改进Alexnet网络的羊脸识别方法,其特征在于,包括以下步骤:
S1,采集自然场景下n只羊的羊脸视频数据,并将采集到的羊脸视频数据转换为羊脸图片数据;
S2,对所述羊脸图片数据进行筛选,得到羊脸数据集;将所述羊脸数据集划分为训练集和测试集,所述训练集和测试集中均划分有正脸数据集、侧脸数据集和羊个体数据集;
S3,将所述训练集输入到改进后的Alexnet网络中进行训练,得到训练后的网络模型;
S4,将所述测试集输入到训练后的网络模型中,得到羊脸分类结果;
S5,验证模型鲁棒性,采集所述n只羊m天之后的羊脸图片数据作为验证集,将所述验证集输入到训练后的网络模型中,得到验证集羊脸识别的准确率;
步骤S3中,所述改进后的Alexnet网络的实现包括以下步骤:
S301,在原始Alexnet网络的基础上扩大感受野的尺寸,将原始Alexnet网络的第一卷积层的卷积核由11*11改为1*1、3*3、5*5、7*7进行多尺度特征提取;
S302,取消原始Alexnet网络中的局部归一化处理;
S303,将SEnet注意力机制模块引入原始Alexnet网络来增强特征提取;
S304,用mish激活函数取代原始Alexnet网络中的Relu激活函数。
2.根据权利要求1所述的一种基于改进Alexnet网络的羊脸识别方法,其特征在于,步骤S1包括以下步骤:
S101,基于不同的采集距离,连续采集羊的一边侧脸到正脸、再到另一边侧脸的羊脸视频数据;
S102,通过MATLAB平台将采集的羊脸视频数据转换为JPG格式的羊脸图片数据。
3.根据权利要求2所述的一种基于改进Alexnet网络的羊脸识别方法,其特征在于,步骤S2包括以下步骤:
S201,将步骤S102中得到的羊脸图片每隔4帧选取一张;
S202,通过计算两张图片的SSIM来判断图片之间的相似性,剔除相似性较大的图片;
SSIM的计算指标公式为:
其中,μa为图片a的均值像素,μb为图片b的均值像素;为图片a的方差,为图片b的方差,σab为图片a、b的协方差;x1为图a像素强度的平均值,x2为图b像素强度的平均值;
SSIM的取值范围为[-1,1],当SSIM取值为-1时,表示两张图片的相似度为0;当SSIM取值为1时,表示两张图片完全相同;
设定SSIM的阈值为0.8,当SSIM的值大于0.8时,表示两张图片相似,只保留其中一张图片在数据集中;当SSIM的值小于或等于0.8时,表示两张图片不相同,保留两张图片在数据集中;
S203,采用随机剪裁、翻转、旋转、高斯加噪中的一种或多种方式,对采集到的数据集进行均衡化处理以及数据增强;
S204,将增强后的数据集划分为正脸数据集、侧脸数据集和羊个体数据集,并分别从这三个数据集中抽取4/5的图片数据组成训练集,将这三个数据集中剩余的1/5的图片数据组成测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉方芯科技有限公司,未经武汉方芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111019519.0/1.html,转载请声明来源钻瓜专利网。