[发明专利]一种种子近红外光谱和光谱图像定性分析模型建立方法有效
| 申请号: | 201510355686.0 | 申请日: | 2015-06-24 |
| 公开(公告)号: | CN104990891B | 公开(公告)日: | 2017-10-20 |
| 发明(设计)人: | 安冬;贾仕强;刘旭;冉航;赵盛毅 | 申请(专利权)人: | 中国农业大学 |
| 主分类号: | G01N21/359 | 分类号: | G01N21/359;G01N21/25 |
| 代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 李相雨 |
| 地址: | 100193 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 种子 红外 光谱 图像 定性分析 模型 建立 方法 | ||
技术领域
本发明涉及光谱和光谱图像检测技术领域,尤其涉及一种种子近红外光谱和光谱图像定性分析模型建立方法。
背景技术
常规的定性分析模型建立流程包括建立数据集,数据预处理,特征提取,建立模型,系统测试,模型优化等步骤。建立一个满足要求的模型比较困难和复杂,需要在每一步中选择合适的方法,调整参数;而且需要分析人员具备专业知识,一般的人员并不能很好地利用近红外光谱(光谱图像)技术进行定性分析,常规定性分析模型的分析效率较低。
常规的定性分析模型建立方法只考虑了模型训练集的正确率,对模型的稳健性却没有给予足够的重视,导致建立的模型适应性差,需要不断更新。建立一个满足要求的种子定性分析模型需要大量的样本,同时需要考虑遗传背景、生长环境、季节变化、收获时间、存储方式、仪器状态变化等因素对光谱的影响,因此建立一个理想的模型往往需要花费很长的时间。
现有的模式识别方法在对种子等天然产物进行识别时效果不佳,存在一定的缺陷。同一类别的种子不同产地和年份的样品可能有很大的差异,现有的基于划分的模式识别方法(支出向量机等)和逐类建模方法(最近邻方法)不能将这些样品分为一类。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决或者减缓上述问题的种子近红外光谱和光谱图像定性分析模型建立方法,提高了建立定性分析模型的效率以及定性分析模型的稳健性。
本发明提供了一种种子近红外光谱和光谱图像定性分析模型建立方法,该方法包括:
在不同的环境中采集每个类别的样品数据,并确定模型训练数据集和测试数据集,所述样品数据为近红外光谱数据和/或光谱图像;
采用不同的数据预处理方法和/或特征提取方法对所述模型训练数据集中的样品数据进行处理,获取不同类别的样品数据之间的可分性、分类正确度和偏离度;
根据所述可分性、分类正确度和偏离度选择最佳数据预处理方法和最佳特征提取方法;
根据所述分类正确度确定所述最佳特征提取方法的最优数据维数;
根据所述最佳数据预处理方法、最佳特征提取方法以及最优数据维数提取所述模型训练数据集中的样品数据的特征;
采用改进的仿生模式识别方法建立定性分析模型。
可选的,在所述采用改进的仿生模式识别方法建立定性分析模型之后,所述方法还包括:
采用建立的定性分析模型对所述测试数据集进行鉴定,并获取正确率指标;
根据所述正确率指标对所述定性分析模型的性能进行测试。
可选的,所述获取不同类别的样品数据之间的可分性、分类正确度和偏离度,包括:
计算所述模型训练数据集中样本数据的类内类间距离,根据所述类内类间距离确定所述模型训练数据集中不同类别的样品数据之间的可分性;
获取所述模型训练数据集中样本数据的总数量N和正确分类的样本数据的数量M,根据所述样本数据的总数量N和正确分类的样本数据的数量M计算分类正确度CA,CA=M/N;
获取所述模型训练数据集中任意两个类别数据的中心距离Dmn以及每一类别中的不同数据点的中心距离Dm和Dn,并采用如下公式计算模型训练数据集中任意两个类别数据的偏离度D:
可选的,所述计算所述模型训练数据集中样本数据的类内类间距离,包括:
获取所述模型训练数据集中样本数据的类间离散度矩阵和类内离散度矩阵估计
其中,mi表示第i类样本数据的均值向量,m表示所有各类的样本数据的总平均向量,c为样本数据的类别数目,Pi为相应类别的先验概率,T表示矩阵转置,为第i类的特征向量;
根据所述类间离散度矩阵和类内离散度矩阵估计计算所述模型训练数据集中各类别的样本数据的类内类间距离,作为可分性J:
其中,Tr()表示计算矩阵的迹。
可选的,所述根据所述可分性、分类正确度和偏离度选择最佳数据预处理方法和最佳特征提取方法,包括:
当采用某一数据预处理方法和/或特征提取方法对所述模型训练数据集中的样品数据进行处理之后,计算其各类别的样品数据之间的可分度J和分类正确度CA;
选择使得J或CA的值最大的数据预处理方法为最佳数据预处理方法,和/或,选择使得J或CA的值最大的特征提取方法为最佳特征提取方法;
根据所述偏离度确定最佳的样品数据采集方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510355686.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





