[发明专利]基于π模型的织物纤维成分半监督分类方法在审
申请号: | 202111040595.X | 申请日: | 2021-09-06 |
公开(公告)号: | CN113887317A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 池明旻 | 申请(专利权)人: | 池明旻 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳叁众知识产权代理事务所(普通合伙) 44434 | 代理人: | 宋鹏飞 |
地址: | 200082 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 织物 纤维 成分 监督 分类 方法 | ||
1.基于π模型的织物纤维成分半监督分类方法,其特征在于,方法包括以下步骤:
采集和清洗织物近红外高光谱数据,所述高光谱数据包含有标签数据和无标签数据;
将所述织物有标签数据输入特征提取神经网络和分类器,得到模型输出的概率分布,与其对应标签求交叉熵损失;将所述织物无标签数据分别进行两次随机数据增强,得到一个无标签样本对,将所述样本对输入特征提取神经网络和分类器,得到模型输出的样本对概率分布;衡量同一样本对的不同输出概率分布的L2距离,对该样本对求无监督的MSE损失;将所述交叉熵损失和MSE损失结合为总损失,更新特征提取神经网络模型;
神经网络模型训练完成后,使用所述神经网络模型对织物高光谱数据分类。
2.根据权利要求1所述的方法,其特征在于,所述步骤有标签数据训练进一步包括:
针对近红外高光谱序列数据的特点,构建基于一维卷积神经网络的特征提取网络;
由于所述织物近红外高光谱数据中有标签数据量少的特点,所述神经网络模型容易产生过拟合的问题,故设置阈值e,若有标签数据输入神经网络模型输出的概率分布向量最大值大于e,则不计入有监督损失;
对于所述有标签数据训练流程,在训练早期,以均匀采样获得有标签训练数据;在训练晚期,以随机加权采样获得有标签训练数据。
3.根据权利要求1所述的方法,其特征在于,所述无标签数据训练进一步包括:
所述特征提取神经网络模型与有标签训练中的神经网络模型共享参数;
所述无标签样本对由同一样本经过随机数据增强得到,为避免数据增强太剧烈,导致数据失真的问题,设置阈值r;若某条采样点与其数据增强后的样本余弦距离的绝对值小于r,则不计入无监督损失。可以用公式表示为:
其中
其中X是无标签训练数据序列向量,X'是X的数据增强副本;
对于所述无标签数据对计算得到的MSE损失,设置一个阈值β,取为0.6。若无监督概率分布最大值未达到阈值,则不计入损失。可以用判定函数公式表示为:
其中x为输入数据,p为分类器输出的概率分布向量;
所述无标签样本对输入特征提取神经网络和分类器得到输出概率分布;为了使概率分布更容易满足置信度阈值β,使用结合温度系数的分类器,公式如下:
其中τ为温度系数;
对于所述无标签数据训练流程,始终以均匀采样获得无标签训练数据。
4.根据权利要求1所述的方法,其特征在于,所述有标签数据损失和无标签数据损失的结合进一步包括:
总损失为有标签数据损失加一个与训练代数相关的系数w(t)乘以无标签数据损失的积的和。可通过如下公式计算:
其中t为当前训练代数,T为总训练代数,μ为常数,一般取10,以增大无标签数据损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于池明旻,未经池明旻许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111040595.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种余甘子特色果醋的制备方法
- 下一篇:一种发酵泡辣椒及其制备方法