[发明专利]基于π模型的织物纤维成分半监督分类方法在审

申请号：	202111040595.X	申请日：	2021-09-06
公开（公告）号：	CN113887317A	公开（公告）日：	2022-01-04
发明（设计）人：	池明旻	申请（专利权）人：	池明旻
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	深圳叁众知识产权代理事务所(普通合伙) 44434	代理人：	宋鹏飞
地址：	200082 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于模型织物纤维成分监督分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于π模型的织物纤维成分半监督分类方法，其特征在于，方法包括以下步骤：

采集和清洗织物近红外高光谱数据，所述高光谱数据包含有标签数据和无标签数据；

将所述织物有标签数据输入特征提取神经网络和分类器，得到模型输出的概率分布，与其对应标签求交叉熵损失；将所述织物无标签数据分别进行两次随机数据增强，得到一个无标签样本对，将所述样本对输入特征提取神经网络和分类器，得到模型输出的样本对概率分布；衡量同一样本对的不同输出概率分布的L2距离，对该样本对求无监督的MSE损失；将所述交叉熵损失和MSE损失结合为总损失，更新特征提取神经网络模型；

神经网络模型训练完成后，使用所述神经网络模型对织物高光谱数据分类。

2.根据权利要求1所述的方法，其特征在于，所述步骤有标签数据训练进一步包括：

针对近红外高光谱序列数据的特点，构建基于一维卷积神经网络的特征提取网络；

由于所述织物近红外高光谱数据中有标签数据量少的特点，所述神经网络模型容易产生过拟合的问题，故设置阈值e，若有标签数据输入神经网络模型输出的概率分布向量最大值大于e，则不计入有监督损失；

对于所述有标签数据训练流程，在训练早期，以均匀采样获得有标签训练数据；在训练晚期，以随机加权采样获得有标签训练数据。

3.根据权利要求1所述的方法，其特征在于，所述无标签数据训练进一步包括：

所述特征提取神经网络模型与有标签训练中的神经网络模型共享参数；

所述无标签样本对由同一样本经过随机数据增强得到，为避免数据增强太剧烈，导致数据失真的问题，设置阈值r；若某条采样点与其数据增强后的样本余弦距离的绝对值小于r，则不计入无监督损失。可以用公式表示为：

其中

其中X是无标签训练数据序列向量，X'是X的数据增强副本；

对于所述无标签数据对计算得到的MSE损失，设置一个阈值β，取为0.6。若无监督概率分布最大值未达到阈值，则不计入损失。可以用判定函数公式表示为：

其中x为输入数据，p为分类器输出的概率分布向量；