[发明专利]一种基于特征筛选的深度学习分类方法在审
| 申请号: | 202011288159.X | 申请日: | 2020-11-17 |
| 公开(公告)号: | CN112434732A | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 杜少毅;王娟;龙红;韩泓丞;杨静;崔文婷 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 王艾华 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 筛选 深度 学习 分类 方法 | ||
1.一种基于特征筛选的深度学习分类方法,其特征在于:该图像分类方法包括以下步骤:
首先采集数据,对数据进行预处理,然后利用处理后的数据集分别在多个深度卷积神经网络包括Xception,ResNet,DensNet,GooLeNet上进行模型训练,调整模型参数使每个模型得到最优结果,将输入图像通过卷积神经网络全连接层的特征向量提取出来;然后使用本发明所提出的基于特征筛选的深度学习分类方法实现最终图像类别的精确预测。
2.根据权利要求1所述的一种基于特征筛选的深度学习分类方法,其特征在于:包括以下步骤:
1)首先收集数据集,然后对得到的数据集进行预处理,包括转换原始数据格式、裁切数据的感兴趣区域,并对数据进行旋转,镜像,裁切,平移,归一化等操作,然后对数据集进行独立同分布采样,将数据集划分为训练集,验证集和测试集;
2)利用收集数据集分别在多个深度卷积神经网络,如Xception,ResNet,DensNet,GooLeNet等中进行网络模型的训练,使每个模型得到最优结果;
3)将步骤2)获得的具有最优结果的模型进行保存,使提出的特征筛选的方法对网络模型全连接层输出的特征向量进行筛选,从而得到与目标类别相关性较高的特征;
4)根据步骤3)得到新的特征子集,在特征子集上采用机器学习的分类算法如支持向量机,决策树以及逻辑回归等实现类别预测。
3.根据权利要求2所述的一种基于特征筛选的深度学习分类方法,其特征在于:所述步骤2)包括以下具体步骤:
2.1)根据收集的数据,在多个深度卷积神经网络,如Xception,ResNet,DensNet,GooLeNet等模型上使用相同的训练集数据进行训练,设置网络的迭代次数,学习率等参数,并初始化模型的权重w和b由,通过网络前向传播:卷积层初步提取特征、池化层提取主要特征、全连接层将各部分特征汇总、产生分类器,得到预测值;
2.2)根据预测值与真值计算损失函数,通过函数优化方法进行反向传播,更新模型权重w,b来减少损失,其计算公式如下:
其中,λ表示学习率,wi表示第i个参数的权重,J(w,b)为损失函数,常用的分类损失主要是交叉熵损失函数,最后使用梯度下降法对目标函数中参数wi和b进行权重更新。
2.3)重复上述步骤,直到达到训练次数或训练的模型在验证集上的损失不再下降得到最优的分类模型。
4.根据权利要求2所述基于特征筛选的深度学习分类方法,其特征在于:所述步骤3)包含以下具体步骤:
3.1)通过训练得到最优的模型,然后提取输入图像在模型全连接层的特征,基于特征筛选的准则去除该模型全连接层后的冗余,噪声以及相关性较低的特征得到一个新的特征子集;
3.2)可选的特征筛选的准则很多,如卡方检验,Pearson相关系数,主成分分析等,以Pearson相关系数为例度量自变量与因变量之间的相关性,以此作为特征筛选的准则,其计算公式如下:
式中:变量A,B,假设样本数据量为n,则两变量之间的相关系数rAB表示如上述公示所示,——样本的平均值;——A和B的协方差;——A,B的标准差;
3.3)经过步骤3.2)后得到一组关于特征与目标T的Pearson相关系数按照一定筛选原则P,如对特征进行筛选。对给定n个数据样本点{(x1,y1),(x2,y2),…,(xn,yn)},其中每个xi由m个特征属性(Ai1;Ai2;…;Aim)描述实例,Aij表示样本xi的第j个属性上的取值。如果特征Ai(i<m)的相关系数则保留此特征,反之则舍弃该特征。通过这样的筛选方法可以得到一个新的特征集,该特征集是原始数据特征集的子集。
5.根据权利要求2所述一种基于特征筛选的深度学习分类方法,其特征在于:所述步骤4)包含以下具体步骤:
4.1)根据步骤3)得到一组与目标相关性高,低冗余的特征子集;
4.2)根据步骤4.1),采用机器学习的算法:支持向量机,决策树,逻辑回归等算法,设置模型参数,在该特征子集的训练集数据训练模型;
4.3)根据步骤4.2)根据训练好的模型,在测试集上进行训练实现类别的精确预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011288159.X/1.html,转载请声明来源钻瓜专利网。





