[发明专利]一种基于Keras框架和深度神经网络的图片分类方法有效
| 申请号: | 201910529685.1 | 申请日: | 2019-06-19 |
| 公开(公告)号: | CN110378383B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 韩飞;方升;凌万云;凌青华;吴伟康 | 申请(专利权)人: | 江苏大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/08;G06F16/55 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 212013 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 keras 框架 深度 神经网络 图片 分类 方法 | ||
本发明公开了一种基于Keras框架和深度神经网络的图片分类方法,包括对图片数据的预处理;通过构建卷积神经网络和全连接神经网络来训练模型,对手写数字图片数据进行识别。本发明充分利用Keras框架的高度模块化,极简和快速实验的优点,运用卷积神经网络的结构,解决以往研究人员事先确定参数以及每层维度的问题,进一步提高做实验的效率,从而减少研究人员实验时间并且提高手写数字识别准确性。
技术领域
本发明属于计算机应用技术领域,具体是一种基于Keras框架和深度神经网络的图片分类方法。
背景技术
深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出,基于深度置信网络(DBN) 提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。深度学习是机器学习中一种基于对数据进行表征学习的方法,观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等,而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。
Keras是基于Theano的一个深度学习框架,也是一个高层神经网络API,它的设计参考Torch,使用纯Python编写而成并基于Tensorflow和CNTK后端。Keras为支持快速实验而生,能够把你的idea迅速转换为结果,是一个高度模块化的神经网络库,支持GPU和 CPU处理器。然而,以往研究采用Keras方法进行图片识别过程中存在需要事先确定参数以及每层维度的问题,代码执行效率低,图片分类效果不佳。
发明内容
针对上述技术问题的不足,本发明提出了一种基于Keras框架和深度神经网络的图片分类方法。
本发明的构思是:做深度学习,首先要有数据进行训练和测试,也就是训练集和测试集,本发明的数据集包括训练集、验证集和测试集,总共有55000个训练样本,5000个验证样本和10000个测试样本,每个样本是由数字图片和一个真实值组成,图片是黑白的,像素是28*28,m个样本数据是二维数据(m,784)。数据集需要先从网址 https://s3.amazonaws.com/img-datasets/mnist.npz网站中下载,将下载成功的mnist.npz文件放在D:\keras-mnis目录中,再通过keras.datasets.mnist.load_data函数加载 D:\keras-mnis\mnist.npz数据集,函数中的path参数是下载数据集的目录地址,该函数返回两个元组,第一个元组是训练集数据和对应的类别号,第二个元组是测试集数据和对应的类别号,训练集和测试集的类别号都是一个数字(0-9),需要把每个数字转换成对应的one-hot 编码,因为有10个类别0-9,所以每个样本的真实值由10个0和1组成,图片上数字是在对应的索引上为1,其他为0;由于后面的代码编写需要one-hot编码的真实值,所以我们需要对进真实值进行one-hot编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910529685.1/2.html,转载请声明来源钻瓜专利网。





