[发明专利]一种基于二值化图像分类网络的图像分类方法有效

申请号：	202110650074.X	申请日：	2021-06-10
公开（公告）号：	CN113392899B	公开（公告）日：	2022-05-10
发明（设计）人：	刘启和;王钰涵;周世杰;张准;董婉祾;但毅;严张豹	申请（专利权）人：	电子科技大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/28;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304	代理人：	罗江
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于二值化图像分类网络方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于二值化图像分类网络的图像分类方法，其特征在于，包括以下步骤：

S1：采集原始图像，并对原始图像进行初始化；

S2：根据初始化后的原始图像，搭建图像分类网络；

S3：利用图像分类网络的softmax分类器进行图像分类；

所述步骤S1包括以下子步骤：

S11：采集尺寸为224*224*3的原始图像，并在原始图像的四周各添加宽度为3的0元素，得到尺寸为230*230*3的第一输出图像；

S12：利用尺寸为7*7且步长为1的卷积核对第一输出图像进行卷积操作，得到尺寸为224*224*64的第二输出图像，并对第二输出图像进行批量归一化，得到尺寸为224*224*64的第三输出图像；

S13：利用非线性激活函数H(x)对第三输出图像进行激活，并对激活后的第三输出图像进行最大池化，得到尺寸为112*112*64的第四输出图像；

S14：利用符号函数S(x')对第四输出图像进行二值化，得到尺寸为112*112*64的第五输出图像，完成原始图像初始化；

所述步骤S2包括以下子步骤：

S21：在第五输出图像的四周各添加宽度为1的0元素，得到尺寸为114*114*64的第六输出图像；

S22：利用尺寸为3*3且步长为1的二值化卷积核对第六输出图像进行卷积操作，得到尺寸为112*112*128的第七输出图像；

S23：利用非线性激活函数H(x)对第七输出图像进行激活，并对激活后的第七输出图像进行最大池化，得到尺寸为56*56*128的第八输出图像；

S23：在第八输出图像的四周各添加宽度为1的0元素，得到尺寸为58*58*128的第九输出图像；

S24：利用尺寸为3*3且步长为1的二值化卷积核对第九输出图像进行卷积操作，得到尺寸为56*56*256的第十输出图像；

S25：利用非线性激活函数H(x)对第十输出图像进行激活，并对激活后的第十输出图像进行最大池化，得到尺寸为28*28*256的第十一输出图像；

S26：在第十一输出图像的四周各添加宽度为1的0元素，得到尺寸为30*30*256的第十二输出图像；

S27：利用尺寸为3*3且步长为1的二值化卷积核对第十二输出图像进行卷积操作，得到尺寸为28*28*512的第十三输出图像；

S28：利用非线性激活函数H(x)对第十三输出图像进行激活，并对激活后的第十三输出图像进行最大池化，得到尺寸为14*14*512的第十四输出图像；

S29：在第十四输出图像的四周各添加宽度为1的0元素，得到尺寸为16*16*512的第十五输出图像；

S210：利用尺寸为3*3且步长为1的二值化卷积核对第十五输出图像进行卷积操作，得到尺寸为14*14*512的第十六输出图像；

S211：利用非线性激活函数H(x)对第十六输出图像进行激活，并对激活后的第十六输出图像进行最大池化，得到尺寸为7*7*512的第十七输出图像；

S212：在第十七输出图像的四周各添加宽度为1的0元素，得到尺寸为9*9*512的第十八输出图像；

S213：利用尺寸为3*3且步长为1的二值化卷积核对第十八输出图像进行卷积操作，得到尺寸为7*7*512的第十九输出图像；

S214：利用非线性激活函数H(x)对第十九输出图像进行激活，并对激活后的第十九输出图像进行拉伸，得到尺寸为1*25088的第二十输出图像；

S215：将第二十输出图像输入至两层神经元为4096的全连接层，完成图像分类网络搭建；

所述步骤S2中，对尺寸为3*3的卷积核进行二值化包括以下子步骤：

A21：利用尺寸为3*3*C_in*C_out的第一二值化卷积核B_i1、第二二值化卷积核B_i2、第三二值化卷积核B_i3和第四二值化卷积核B_i4对尺寸为3*3的卷积核分别进行线性近似，其中，C_in表示输入通道数，C_out表示输出通道数；

A22：对线性近似后的卷积核矩阵中的各个元素进行归一化处理，得到归一化处理后的卷积核；

A23：设定第一二值化卷积核B_i1、第二二值化卷积核B_i2、第三二值化卷积核B_i3和第四二值化卷积核B_i4对应的激活阈值，分别为b_i1、b_i2、b_i3和b_i4；

A24：在第一二值化卷积核B_i1、第二二值化卷积核B_i2、第三二值化卷积核B_i3和第四二值化卷积核B_i4中，分别将归一化处理后的卷积核矩阵中小于激活阈值b_i1、b_i2、b_i3和b_i4的参数确定为0，大于激活阈值b_i1、b_i2、b_i3和b_i4的参数确定为1，并随机初始化第一二值化卷积核B_i1、第二二值化卷积核B_i2、第三二值化卷积核B_i3和第四二值化卷积核B_i4的权重，完成尺寸为3*3的卷积核的二值化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110650074.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于二值化图像分类网络的图像分类方法有效

专利文献下载