[发明专利]一种基于二值化图像分类网络的图像分类方法有效
申请号: | 202110650074.X | 申请日: | 2021-06-10 |
公开(公告)号: | CN113392899B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 刘启和;王钰涵;周世杰;张准;董婉祾;但毅;严张豹 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/28;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 罗江 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二值化 图像 分类 网络 方法 | ||
本发明公开了一种基于二值化图像分类网络的图像分类方法,包括以下步骤:S1:采集原始图像,并对原始图像进行初始化;S2:根据初始化后的原始图像,搭建图像分类网络;S3:利用图像分类网络的softmax分类器进行图像分类。该图像分类方法对传统图像分类中运算量最大的卷积运算模块的卷积核进行二值化处理,使用4个同规格的二值化卷积核进行线性近似,节约算法存储空间开销。
技术领域
本发明属于图像分类技术领域,具体涉及一种基于二值化图像分类网络的图像分类方法。
背景技术
近年来,深度神经网络(Deep Neural Network,DNN)在机器学习和模式识别领域带来了革命性的变化。然而,现有的大部分DNN模型计算成本高且内存密集,这阻碍了它们在具有低内存资源的设备或具有严格延迟要求的应用中的部署。
深度神经网络(Deep Neural Network,DNN)在机器学习和模式识别领域带来了革命性的变化。以图像分类为例:LeNet、AlexNet、ResNet、VggNet等经典网络结构接连提出。这些结构主要针对服务器端,训练和推理均在算力充足的硬件环境下,对GPU算力以及存储空间有较高的要求。这对于移动端的部署较为困难,例如无人机、智能小车等硬件条件受限的终端。
发明内容
本发明的目的是为了解决图像分类的问题,提出了一种基于二值化图像分类网络的图像分类方法。
本发明的技术方案是:一种基于二值化图像分类网络的图像分类方法包括以下步骤:
S1:采集原始图像,并对原始图像进行初始化;
S2:根据初始化后的原始图像,搭建图像分类网络;
S3:利用图像分类网络的softmax分类器进行图像分类。
进一步地,步骤S1包括以下子步骤:
S11:采集尺寸为224*224*3的原始图像,并在原始图像的四周各添加宽度为3的0元素,得到尺寸为230*230*3的第一输出图像;
S12:利用尺寸为7*7且步长为1的卷积核对第一输出图像进行卷积操作,得到尺寸为224*224*64的第二输出图像,并对第二输出图像进行批量归一化,得到尺寸为224*224*64的第三输出图像;
S13:利用非线性激活函数H(x)对第三输出图像进行激活,并对激活后的第三输出图像进行最大池化,得到尺寸为112*112*64的第四输出图像;
S14:利用符号函数S(x′)对第四输出图像进行二值化,得到尺寸为112*112*64的第五输出图像,完成原始图像初始化。
进一步地,步骤S14中,符号函数S(x′)的表达式为:
其中,x表示符号函数的输入图像,α表示第一待学习参数。
进一步地,步骤S2包括以下子步骤:
S21:在第五输出图像的四周各添加宽度为1的0元素,得到尺寸为114*114*64的第六输出图像;
S22:利用尺寸为3*3且步长为1的二值化卷积核对第六输出图像进行卷积操作,得到尺寸为112*112*128的第七输出图像;
S23:利用非线性激活函数H(x)对第七输出图像进行激活,并对激活后的第七输出图像进行最大池化,得到尺寸为56*56*128的第八输出图像;
S23:在第八输出图像的四周各添加宽度为1的0元素,得到尺寸为58*58*128的第九输出图像;
S24:利用尺寸为3*3且步长为1的二值化卷积核对第九输出图像进行卷积操作,得到尺寸为56*56*256的第十输出图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110650074.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序