[发明专利]一种基于深度卷积神经网络的模式识别方法有效
| 申请号: | 201811157800.9 | 申请日: | 2018-09-30 |
| 公开(公告)号: | CN109272048B | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 刘博;史超;张佳慧 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06K9/62 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 卷积 神经网络 模式识别 方法 | ||
1.一种基于深度卷积神经网络的模式识别方法,其特征在于:该方法包括以下步骤:步骤1、构建一个169层的DenseNet模型,该DenseNet模型的主干结构是由4个密集连接的稠密块以及4个过渡层交替拼接而成,稠密块与过渡层之间会有若干个卷积核;每个稠密块内,在每次卷积操作开始前都要将之前所有的结果在通道方向上拼接,实现密集连接的特征图传递,一个具有L层的网络,那么highway稠密连接数目为L*(L+1)/2;模型的最后一层为一个Sigmoid输出的全连接层,输出分类结果;
步骤2、对数据集加入噪声,对数据集中每张图片随机添加90、180、270三个角度的旋转,起到扩充数据集的目的;
步骤3、对图像数据集进行相关预处理;
步骤3具体包括以下步骤:
步骤3.1、将每张图像进行灰度处理,凸显目标区域位置及轮廓纹理,并将图像压缩到256*256的尺寸;
步骤3.2、对图像数据集中每张图像做Five Crop到224,有50%几率对图像随机进行水平、竖直翻转;
步骤3.3、使用ImageNet数据集的平均值与方差对数据集进行标准化处理,即对于图像中第i个点的原像素值xi求标准差
其中μ和σ2分别代表ImageNet数据集的均值与方差;
步骤3.4、将图像数据集随机生成五份数据集,每份图像数据集包含不同的训练集与验证集;训练集的数据占所有数据的80%,验证集的数据占所有数据的20%;
步骤4、使用预处理好的数据集对DenseNet模型进行训练;
步骤4具体包括以下步骤:
步骤4.1、DenseNet模型的训练方法采用标准的Adam优化算法对DenseNet模型进行训练优化,训练时的batch size为16;
步骤4.2、在DenseNet模型的每个稠密块之间添加注意力模块;训练50个epoch,让DenseNet模型在训练过程中更关注目标区域;每个epoch之后DenseNet模型都会对验证集进行预测,记录DenseNet模型预测的准确率并输出,前20个epoch学习率设为0.001,第20次开始降为0.0001,第40次降为0.00001;通过五折交叉验证进行训练,生成最终的DenseNet模型作为最后结果;
步骤4.3、保存生成的DenseNet模型,使用测试集的数据对模型分类的准确率做出评价。
2.根据权利要求1所述的一种基于深度卷积神经网络的模式识别方法,其特征在于:DenseNet模型的整体训练平台是基于服务器,在Ubuntu系统上使用Pytorch深度学习框架实现;训练的GPU为两块GTX1080,并使用CUDA作为显卡的运算驱动。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811157800.9/1.html,转载请声明来源钻瓜专利网。





