[发明专利]一种基于机器学习的光谱测量质量判定方法在审
申请号: | 202211292083.7 | 申请日: | 2022-10-20 |
公开(公告)号: | CN115728247A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 郭春付;吴华希;石雅婷;李伟奇 | 申请(专利权)人: | 武汉颐光科技有限公司 |
主分类号: | G01N21/25 | 分类号: | G01N21/25;G01N21/01;G06F18/23;G06F18/2135;G06F18/214;G06F18/24;G06F18/22 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 万畅 |
地址: | 430000 湖北省武汉市东湖新技*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 光谱 测量 质量 判定 方法 | ||
1.一种基于机器学习的光谱测量质量判定方法,其特征在于,所述判定方法包括:
步骤1,对光谱的特征数据进行降维处理得到降维后光谱特征数据;
步骤2,生成包含多个所述降维后光谱特征数据的训练集,对所述训练集中的各个数据点进行聚类模型训练,得到聚类模型及其包含的各个聚类的中心点;
步骤3,对待测光谱的特征数据进行降维处理,基于所述聚类模型对所述待测光谱进行分类得到分类结果,所述分类结果包括:所述待测光谱所属的聚类k、所述待测光谱到其所属聚类k的中心点的距离dk以及所述待测光谱所属聚类k的光谱的数量tk;
步骤4,基于所述待测光谱的分类结果对所述待测光谱的质量进行判定。
2.根据权利要求1所述的判定方法,其特征在于,所述步骤1中对所述光谱进行PCA降维处理。
3.根据权利要求1或2所述的判定方法,其特征在于,所述步骤1包括:
步骤101,对所述光谱特征进行标准化处理,生成标准化后的光谱特征向量;
步骤102,计算光谱特征向量的各维特征之间的协方差矩阵C;
步骤103,求解所述协方差矩阵C的特征值λ及对应的特征向量u,将值最大的K个所述特征值λ对应的特征向量u组成特征平面;
步骤104,将所述光谱特征向量投影到所述特征平面,得到降维后的所述光谱特征。
4.根据权利要求1所述的判定方法,其特征在于,所述步骤2中对所述训练集中各个数据点进行Mean-Shift聚类模型训练。
5.根据权利要求1或4所述的判定方法,其特征在于,所述步骤2包括:
步骤201,估算得到所述训练集的带宽距离d;所述带宽距离d为所述训练集中任意点到临近点的距离的均值;
步骤202,在所述训练集中随机选择n个点作为n个聚类的起始中心点,n为远小于所述训练集中样本个数N的随机参数,所述中心点集合记为C=[c1,c2,…cn];
步骤203,将以任意所述中心点ck为中心、半径为d的区域中出现的所有数据点,归为聚类集合Mk;1≤k≤n;
步骤204,以所述中心点ck为中心点,计算所述中心点ck到所述聚类集合Mk中每个数据点的向量之和,得到偏移向量sk;
步骤205,将所述中心点ck沿着所述偏移向量sk的方向移动,得到新的中心点c_newk=ck+sk;
步骤206,重复步骤203-205,所述偏移向量sk小于设定阈值时判定迭代收敛;若迭代过程中两个所述中心点的距离小于半径d,则将所述两个中心点合并,并将两个中心点所属的两个所述聚类集合合并,形成新的聚类与中心点并继续迭代;
步骤207,重复步骤206直到所有的所述聚类集合都收敛。
6.根据权利要求5所述的判定方法,其特征在于,所述步骤201包括:
步骤20101,随机打乱所述训练集中各个数据点的顺序,对所述训练集中的数据点进行按比例的采样,采样数量为N;
步骤20102,通过KNN算法找到各个所述数据点最近的K临近点;
步骤20103,记录每个数据点的K临近点中距离最远的点,并记录其距离集合D=[d1,d2,…dN];
步骤20104,计算所述集合D的均值为带宽距离
7.根据权利要求6所述的判定方法,其特征在于,所述步骤4还包括:根据所述待测光谱与所述训练集中的光谱的交叉熵判断其之间的分布相似性,根据所述分布相似性判断所述待测光谱的训练结果的可信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉颐光科技有限公司,未经武汉颐光科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211292083.7/1.html,转载请声明来源钻瓜专利网。