[发明专利]一种基于二值化图像分类网络的图像分类方法有效

专利信息
申请号: 202110650074.X 申请日: 2021-06-10
公开(公告)号: CN113392899B 公开(公告)日: 2022-05-10
发明(设计)人: 刘启和;王钰涵;周世杰;张准;董婉祾;但毅;严张豹 申请(专利权)人: 电子科技大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/28;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 代理人: 罗江
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 二值化 图像 分类 网络 方法
【权利要求书】:

1.一种基于二值化图像分类网络的图像分类方法,其特征在于,包括以下步骤:

S1:采集原始图像,并对原始图像进行初始化;

S2:根据初始化后的原始图像,搭建图像分类网络;

S3:利用图像分类网络的softmax分类器进行图像分类;

所述步骤S1包括以下子步骤:

S11:采集尺寸为224*224*3的原始图像,并在原始图像的四周各添加宽度为3的0元素,得到尺寸为230*230*3的第一输出图像;

S12:利用尺寸为7*7且步长为1的卷积核对第一输出图像进行卷积操作,得到尺寸为224*224*64的第二输出图像,并对第二输出图像进行批量归一化,得到尺寸为224*224*64的第三输出图像;

S13:利用非线性激活函数H(x)对第三输出图像进行激活,并对激活后的第三输出图像进行最大池化,得到尺寸为112*112*64的第四输出图像;

S14:利用符号函数S(x')对第四输出图像进行二值化,得到尺寸为112*112*64的第五输出图像,完成原始图像初始化;

所述步骤S2包括以下子步骤:

S21:在第五输出图像的四周各添加宽度为1的0元素,得到尺寸为114*114*64的第六输出图像;

S22:利用尺寸为3*3且步长为1的二值化卷积核对第六输出图像进行卷积操作,得到尺寸为112*112*128的第七输出图像;

S23:利用非线性激活函数H(x)对第七输出图像进行激活,并对激活后的第七输出图像进行最大池化,得到尺寸为56*56*128的第八输出图像;

S23:在第八输出图像的四周各添加宽度为1的0元素,得到尺寸为58*58*128的第九输出图像;

S24:利用尺寸为3*3且步长为1的二值化卷积核对第九输出图像进行卷积操作,得到尺寸为56*56*256的第十输出图像;

S25:利用非线性激活函数H(x)对第十输出图像进行激活,并对激活后的第十输出图像进行最大池化,得到尺寸为28*28*256的第十一输出图像;

S26:在第十一输出图像的四周各添加宽度为1的0元素,得到尺寸为30*30*256的第十二输出图像;

S27:利用尺寸为3*3且步长为1的二值化卷积核对第十二输出图像进行卷积操作,得到尺寸为28*28*512的第十三输出图像;

S28:利用非线性激活函数H(x)对第十三输出图像进行激活,并对激活后的第十三输出图像进行最大池化,得到尺寸为14*14*512的第十四输出图像;

S29:在第十四输出图像的四周各添加宽度为1的0元素,得到尺寸为16*16*512的第十五输出图像;

S210:利用尺寸为3*3且步长为1的二值化卷积核对第十五输出图像进行卷积操作,得到尺寸为14*14*512的第十六输出图像;

S211:利用非线性激活函数H(x)对第十六输出图像进行激活,并对激活后的第十六输出图像进行最大池化,得到尺寸为7*7*512的第十七输出图像;

S212:在第十七输出图像的四周各添加宽度为1的0元素,得到尺寸为9*9*512的第十八输出图像;

S213:利用尺寸为3*3且步长为1的二值化卷积核对第十八输出图像进行卷积操作,得到尺寸为7*7*512的第十九输出图像;

S214:利用非线性激活函数H(x)对第十九输出图像进行激活,并对激活后的第十九输出图像进行拉伸,得到尺寸为1*25088的第二十输出图像;

S215:将第二十输出图像输入至两层神经元为4096的全连接层,完成图像分类网络搭建;

所述步骤S2中,对尺寸为3*3的卷积核进行二值化包括以下子步骤:

A21:利用尺寸为3*3*Cin*Cout的第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4对尺寸为3*3的卷积核分别进行线性近似,其中,Cin表示输入通道数,Cout表示输出通道数;

A22:对线性近似后的卷积核矩阵中的各个元素进行归一化处理,得到归一化处理后的卷积核;

A23:设定第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4对应的激活阈值,分别为bi1、bi2、bi3和bi4

A24:在第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4中,分别将归一化处理后的卷积核矩阵中小于激活阈值bi1、bi2、bi3和bi4的参数确定为0,大于激活阈值bi1、bi2、bi3和bi4的参数确定为1,并随机初始化第一二值化卷积核Bi1、第二二值化卷积核Bi2、第三二值化卷积核Bi3和第四二值化卷积核Bi4的权重,完成尺寸为3*3的卷积核的二值化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110650074.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top