[发明专利]基于Stacking集成框架的光谱特征变量选择与优化方法有效

专利信息
申请号: 201910824079.2 申请日: 2019-09-02
公开(公告)号: CN110674947B 公开(公告)日: 2021-02-19
发明(设计)人: 任顺;张畅;任东;徐守志;杨信廷;马凯;张雄;陆安祥 申请(专利权)人: 三峡大学
主分类号: G06N20/00 分类号: G06N20/00;G06N3/12;G01N21/359;G01N21/3577
代理公司: 宜昌市三峡专利事务所 42103 代理人: 成钢
地址: 443002 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 stacking 集成 框架 光谱 特征 变量 选择 优化 方法
【说明书】:

发明公开了基于Stacking集成框架的光谱特征变量选择与优化方法,包括构建样本集,将样本集分为训练样本集和测试样本集;在变量区间选择法、变量信息选择法、变量优化选择法大类中选出具有代表性的特征变量选择方法;构建多个基学习器,采用Stacking集成框架将基学习器集成,构建元学习器,将基学习器的输出作为元学习器的输入;利用样本集对Stacking集成框架的基学习器和元学习器进行训练与测试;将待检测光谱信息输入基学习器,依据元学习器的输出得到待检测光谱的检测结果。本发明的基于Stacking集成框架的光谱特征变量选择与优化方法克服了单一特征变量选择方法的缺陷,对测试样本的检测精度高,检测结果稳定性好。

技术领域

本发明属于光谱分析领域,具体涉及基于Stacking集成框架的光谱特征变量选择与优化方法。

背景技术

近红外光谱NIR(Near Infrared)区按美国试验和材料检测协会定义是指波长在780~2526nm范围内的电磁波。属于分子振动光谱的倍频和主频吸收光谱,近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的。而近红外光谱区与有机分子中含氢基团(O-H、N-H、C-H)振动的合频和各级倍频的吸收区一致,包含了大多数类型有机化合物的组成和分子结构的信息。因此,近红外光谱分析技术可用于多种有机物的定性分析和定量分析。

NIR是近几十年来发展迅速的高新分析技术之一。目前大约有50多个国家和地区开展了NIR的研究和应用工作,特别是一些发达国家表现得尤为突出,这些国家拥有大量的各种类型的NIR分析仪器用于各行各业。这些仪器在农业、石化、制药、食品等领域都得到很好应用,并取得极好的社会和经济效益。

近红外光谱数据具有很高的空间复杂度,数据还包含了背景噪声、仪器误差、人为误差,以及非待测成分的信息等干扰因素。正是由于光谱分析技术面临着信息重叠、相关性、复杂性等问题,因此,对光谱特征变量选择的研究尤为必要,是当前的一个研究热点。近年来,国内外众多学者对特征选择问题进行了研究,在多元校正分析中的波长选择方法主要有相关系数法、方差分析法、逐步回归法、无信息变量的消除法、间隔偏最小二乘法、粒子群算法等。

现阶段常用的光谱特征变量选择方法均有其缺陷,如无信息变量的消除法只评估单个特征与结果之间的关系,虽然计算量小,能避免过拟合,但没有考虑特征之间的关联。间隔偏最小二乘法通过区间的划分提高了效率,但没能考虑到区间之间的关联,且选出的区间仍包含大量冗余信息。粒子群算法具有较强的随机性,选出的变量集合不稳定。

发明内容

本发明的技术问题是现有的单一的光谱特征变量选择方法均存在缺陷,变量区间选择法容易忽视区间之间的关联,一旦特征被选择或者删除,将无法再参与后续变量选择过程,即所谓的“筑巢(nesting)效应”,且区间变量划分缺乏理论指导;变量信息选择法是基于单变量的,无法判断相关的冗余变量,尽管有些变量单从自身而言似乎并不重要,但与其它变量组合后,可能显著提高整个模型的判别性能,而单变量选择方法无法识别出这些变量,导致重要信息的丢失;变量优化方法忽视了随机误差对变量选择的影响,选出的最佳变量子集缺乏稳定性,且对初始化和评价准则非常敏感,随机性较强,无法保证每次选出的变量的一致性。

本发明的目的是解决上述问题,提出基于Stacking集成框架的光谱特征变量选择与优化方法,克服单一特征变量选择方法的缺陷,提高预测精度。

本发明的技术方案是基于Stacking集成框架的光谱特征变量选择与优化方法,包括以下步骤,

步骤1:构建样本集,将样本集分为训练样本集和测试样本集;

步骤2:在变量区间选择法、变量信息选择法、变量优化选择法大类中选出具有代表性的特征变量选择方法;

步骤3:利用步骤2选出的特征变量选择方法构建多个基学习器,采用Stacking集成框架将基学习器集成,构建元学习器,将基学习器的输出作为元学习器的输入;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910824079.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top