[发明专利]基于投票机制的多模态近红外光谱建模分类方法在审
| 申请号: | 202211200929.X | 申请日: | 2022-09-29 |
| 公开(公告)号: | CN115481664A | 公开(公告)日: | 2022-12-16 |
| 发明(设计)人: | 贾利红;张国宏;李光尧;王毅 | 申请(专利权)人: | 四川启睿克科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
| 地址: | 610000 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 投票 机制 多模态近 红外 光谱 建模 分类 方法 | ||
本发明基于投票机制的多模态近红外光谱建模分类方法,涉及近红外光谱检测技术领域,通过将光谱数据分成训练集和验证集,并利用M种预处理和N种建模方法,建立M*N个模型,并选取验证集的最优准确率指标较高的K种模型对待测样本进行分类,将同一待测样本的K种分类结果一致的作为高置信度结果保存,重新划分训练集和验证集、建立模型、选择模型对待测样本进行分类,得到另一组结果,直到每个待测样本均有至少一个高置信度结果时,基于投票机制,对高置信度结果进行分析,获得每种待测样本的分类结果,以此解决了近红外光谱模型进行分类时准确率低的问题,本发明适用于近红外光谱检测。
技术领域
本发明涉及近红外光谱检测技术领域,特别涉及基于投票机制的多模态近红外光谱建模分类方法。
背景技术
在近红外光谱定性分析中,由于近红外光谱检测数据量的有限性,目前行业内主要采用传统的支撑向量机、决策树、线性判别等方法,无法进一步采用神经网络等较高复杂度的算法。而近红外光谱数据在采集的过程中,极易受到周围环境及人为操作的影响,数据一致性较差,这就造成了近红外光谱模型在实际应用中,稳定性及预测准确率一直不理想,尤其在较多(超过5个)类别的分类中,光谱数据串扰较大,缺陷更为明显。
发明内容
本发明所解决的技术问题:提供一种基于投票机制的多模态近红外光谱建模分类方法,解决近红外光谱模型进行分类时准确率低的问题。
本发明解决上述技术问题采用的技术方案:基于投票机制的多模态近红外光谱建模分类方法,包括以下步骤:
S01、获取不同类别的多个样本的光谱数据以及样本的类别;
S02、将光谱数据分为训练集和验证集;
S03、对训练集中的光谱数据分别进行M种预处理;
S04、提取主成分;
S05、分别采用N种方法进行建模,获得M*N种模型;
S06、选取M*N种模型中验证集的最优准确率指标从高到低排序前K种模型,作为分类模型;
S07、利用K种分类模型对待测样本进行分类,获得K种结果;
S08、将K种结果中同一待测样本分类结果一致的作为高置信度结果保存;
S09、重新划分训练集和验证集,并重复步骤S03至S08,直到所有待测样本均有至少一个高置信度结果;
S10、基于投票机制,对高置信度结果进行分析,获得每个待测样本的分类结果。
进一步的,S03中,所述M种预处理包括高斯平滑、高斯求导、SG平滑、SG求导、snv、去趋势、标准化、MSC、中心化和baseline中的一种或多种。
进一步的,S05中,所述N种方法包括SVM、LDA、决策树和神经网络中的一种或者多种。
进一步的,所述K为3。
进一步的,步骤S02中,训练集和验证集的比例为3比1。
进一步的,S10中,所述投票机制为:对于同一待测样本,其高置信度结果中划分的类别占比最高的分类结果为待测样本的分类结果,如果同一待测样本的高置信度结果中占比最高的分类结果为多个类别时,则以该类别在中样本数量最多的类别作为分类结果,如果样本数量也相等,则以样本类别在模型训练中的编码顺序靠前的类别作为分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川启睿克科技有限公司,未经四川启睿克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211200929.X/2.html,转载请声明来源钻瓜专利网。





