[发明专利]基于模拟退火算法的近红外光谱波长子区间选择方法有效
| 申请号: | 201010123945.4 | 申请日: | 2010-03-12 |
| 公开(公告)号: | CN101807228A | 公开(公告)日: | 2010-08-18 |
| 发明(设计)人: | 邹小波;石吉勇;赵杰文;殷晓平;陈正伟;黄星奕;蔡建荣;陈全胜 | 申请(专利权)人: | 江苏大学 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00;G01N21/35 |
| 代理公司: | 南京知识律师事务所 32207 | 代理人: | 汪旭东 |
| 地址: | 212013 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 模拟 退火 算法 红外 光谱 波长 区间 选择 方法 | ||
技术领域
本发明涉及一种对农产品或食品品质进行分析的近红外光谱特征波长特征子区间选择 方法,特指基于模拟退火算法的近红外光谱波长特征子区间的选择方法。
背景技术
目前,近红外光谱技术在农产品、食品品质分析方面的运用越来越广泛。但近红外技 术本身也存在一定的不足,如背景复杂、信息强度低,谱峰重叠等,使得难以用常规的谱 图解析方法解析近红外光谱,如何有效的从大量近红外光谱数据中提取特征信息成为了国 内外学者研究的重点。样品在近红外光谱的某个或者某几个波段发生特征吸收,决定了高 信息量波数点邻近的波数点也具有较高的信息量,即近红外光谱数据具有一定的连续相关 性。根据近红外光谱数据的这一特点,兼顾减少波长选择算法计算量,提高算法效率等要 求,通常将近红外全光谱分成若干个子区间,以区间为单位进行波长选择。经典光谱区间 选择算法有间隔偏最小二乘法,该算法是将全光谱分成若干个子区间,分别计算各个子区 间的交互验证均方根误差RMSECV(Root Mean Square of Cross Validation),将交换验证均 方根误差最小的一个区间作为建模区间。间隔偏最小二乘算法的衍生算法有联合区间偏最 小二乘法、向前/向后区间偏最小二乘算法、移动窗口偏最小二乘等,同经典区间偏最小二 乘算法相比,衍生算法不仅考察单一区间,还有几个区间的联合。这些算法虽然能提取光 谱的特征信息,但划分子区间的过程具有一定的主观性,同时,区间组合方式单一,不能 确保得到全局最优组合。
模拟退火算法(SAA)是一种适合解决大规模组合化问题,特别是NP完全类问题的 通用有效近似算法,具有描述简单、使用灵活、运用广泛、运行效率高和受初始解约束小 等有点。
发明内容
为了克服上述技术的不足,本发明提出一种基于模拟退火算法的食品、农产品近红外 光谱波长特征子区间选择方法,可客观地划分子区间,区间组合方式不单一,确保得到全 局最优组合。
本发明的技术方案是采用如下步骤:1)对近红外光谱进行预处理,包括对校正集和预 测集样本的划分,将预处理后的近红外光谱的全光谱划分为k个子区间,若总波数点数除 以k等于n,存在余数m,则前m个子区间中每个子区间波数点个数为n+1,剩余子区间 中每个子区间波数点个数为n;2)设置最小子区间数Io、最大子区间数If、目标函数f(x)、 初始化温度t0、温度衰减函数g(α)、结束温度tf、马尔可夫链长度Lk和Metropolis接受新 解准则,采用模拟退火算法选择最佳特征子区间的个数及组合方式,选择完成后,递增子 区间数,由子区间总数i=最小子区间数Io开始以i=i+1的方式递增子区间数、直至i大于最 大子区间数If时递增结束;3)重复执行模拟退火算法,在模拟退火算法结束时比较各种区 间划分方式时的特征子区间最优组合,取目标函数值最大的优化解作为全局最优特征子区 间集合;4)根据全局最优特征子区间集合建立校正集与预测集模型;其特征是:所述模拟 退火算法的步骤包括:
(1)温度为t=t0时,随机选择m个子区间作为旧解x;
(2)在旧解x和未选中的k-m个子区间中,根据子区间交换函数交换子区间后产生新 解y;子区间交换函数h(t)=1-exp(-t),当温度t降低至tn-1时,温度tn-1对应的子区间交换个 数cn-1=c*h(t),c是温度为t时对应的子区间交换个数;
(3)计算新解y、旧解x的目标函数f(x)和f(y);
(4)根据(3)的计算结果,采用Metropolis接受新解准则判断新解y、旧解x的重要 性;
(5)当温度为t时,算法搜索迭代的次数,判断算法搜索迭代的次数是否等于马尔可 夫链长度Lk,如果不等于则重复步骤(2)~(5);否则执行下一个步骤(6);
(6)根据温度衰减函数g(α)降低温度t;
(7)判断温度t是否达到结束温度tf,没有达到结束温度tf则重复执行(2)~(7), 否则执行步骤(8);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010123945.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





