[发明专利]一种近红外光谱模型的鲁棒性改善方法在审
| 申请号: | 201510109849.7 | 申请日: | 2015-03-13 |
| 公开(公告)号: | CN104677498A | 公开(公告)日: | 2015-06-03 |
| 发明(设计)人: | 李海森;高珏;徐超;杜伟东 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G01J3/44 | 分类号: | G01J3/44;G01N21/359 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 红外 光谱 模型 鲁棒性 改善 方法 | ||
技术领域
本发明属于近红外光谱建模技术领域,具体涉及一种近红外光谱模型的鲁棒性改善方法。
背景技术
近红外光谱技术凭借其无损、快速等优点,广泛应用于农业工程、食品分析、环境监测和水声探测等领域。通过近红外光谱,可以建立回归模型和分类模型分别获取样本的定量信息和定性信息。目前研究的焦点大多集中于如何提高模型的预测性能,而对于模型鲁棒性的改善给予的关注相对较少。鲁棒性是模型对光谱数据中不确定因素的适应性,主要表现为模型的抗噪能力和泛化能力。光谱建模时,仪器响应的漂移、样本包含噪声或奇异值、样本不充分等因素都会影响模型的鲁棒性。鲁棒性不足会导致模型应用于不同条件或受噪声影响的光谱数据时,预测误差成倍增长。这一问题严重限制了红外光谱技术的更广泛应用和进一步推广。
为了改善模型的鲁棒性,一种方法是对训练样本进行预处理,从而剔除异常样本,但由于缺乏足够的先验知识,这种方法很难执行;另一种方法是对训练样本引入模糊隶属度,依据样本包含不确定因素的大小、信息的重要性对样本赋予不同的模糊隶属度,通过较小的模糊隶属度赋值来限制异常样本对模型的影响。目前,尽管有多种隶属度函数构造方法,但还没有可遵循的一般性准则。如何根据近红外光谱的特性,构造出符合客观实际的模糊隶属度,从而建立强鲁棒性并具有通用性的模型,使模型在训练样本不充分或测量过程中的各种噪声影响下仍然能稳定而正常的工作是急需要解决的一个难题。
发明内容
本发明的目的是提供一种可以自动生成模糊隶属度,进而构建具有强鲁棒性的模糊支持向量机模型的近红外光谱模型的鲁棒性改善方法。
本发明的目的是这样实现的:
(1)采集样本的漫反射光谱,测定样本的糖度值;
(2)将光谱样本映射到一个高维的特征空间,寻找样本的最小包含超球,构建光谱样本的数据域描述函数,引入信任因子和舍弃因子将光谱的训练样本划分为三个区域,通过映射关系建立数据域描述与概率密度的关联,得到模糊隶属度函数,应用穷举搜索参数寻优法确定模糊隶属度函数中的四个未知参数:信任因子、舍弃因子、映射度和模糊隶属度下限,自动生成每个样本的模糊隶属度;
(3)对样本的近红外光谱、模糊隶属度和糖度数据进行训练,建立模糊支持向量机模型,与光谱分析中常用的多元线性回归、偏最小二乘回归、支持向量机模型进行对比,检验模型的鲁棒性。
步骤(1)所述采集样本的漫反射光谱,采集波长范围是400-1000nm,采样间隔为0.37nm,取四个测试部位的平均光谱作为样本的原始光谱。
步骤(2)所述模糊隶属度函数中D(xi)为光谱数据域描述值,引入信任因子DC和舍弃因子DT将光谱的训练样本划分为三个区域:位于D(xi)<DC区域的光谱样本,样本具有极高的可信度并且赋予模糊隶属度为1;位于D(xi)>DT区域的光谱样本,包含噪声或奇异点,对应的模糊隶属度为最小值σ;位于DC≤D(xi)≤DT,包含噪声或奇异值的概率各不相同,模糊隶属度与包含噪声或奇异值的概率成正比关系。通过映射关系建立数据域描述D(xi)与概率密度px(xi)的关联,由概率密度来表征样本的模糊隶属度,模糊隶属度函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学;,未经哈尔滨工程大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510109849.7/2.html,转载请声明来源钻瓜专利网。





