[发明专利]生物样本分类方法、装置和存储介质在审
申请号: | 202210841609.6 | 申请日: | 2022-07-18 |
公开(公告)号: | CN115146733A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 杨荟楠;刘致元;王晓蕾;杜鹏;郑雨晴;李思龙;程蕊;赵天楠;雷思阳;刘逸隆 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州隆恒知识产权代理事务所(普通合伙) 32366 | 代理人: | 金京 |
地址: | 200000 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 样本 分类 方法 装置 存储 介质 | ||
本申请公开了一种生物样本分类方法、装置和存储介质,涉及光谱检测技术领域,所述方法包括:对于n类生物样本集中的每一类,获取所述生物样本集中的每个生物样本的平均拉曼光谱,n为大于1的整数;基于统计学方法,确定并存储每个平均拉曼光谱中具有差异的拉曼特征峰位;获取每个具有差异的拉曼特征峰位的拉曼特征峰面积;根据生成的各个拉曼特征峰面积训练分类预测网络,所述分类预测网络用于预测目标生物样本的分类。解决了现有技术中分类准确率较低的问题,达到了可以通过具有差异的拉曼特征峰面积作为训练集,进而更全面的反应生物样本的光谱特征,避免分类效果受成分以及拉曼特征峰偏移的影响,提高了样本分类准确率的效果。
技术领域
本发明涉及一种生物样本分类方法、装置和存储介质,属于光谱检测技术领域。
背景技术
拉曼光谱作为一种高灵敏度的指纹光谱,现已被广泛地应用于环境检测、食品安全和生命科学等多个领域中液、固和气相物质的检测研究。支持向量机(Support VectorMachine,SVM)是一种基于机器学习的多变量分类器,能够根据算法中几个关键参数的选择来绘制不同复杂度的类边界以达到对样本进行分类的目的。以生命科学领域为例,基于拉曼光谱和SVM构建的克罗恩病患者与健康对照组(HC)预测分类模型可以区分克罗恩病患者和HC的整体代谢变化,帮助临床医生诊断克罗恩病患者和监测疾病进展与复发情况。
现有方案中,基于拉曼光谱和PCA(principal components analysis,PCA)-SVM构建疾病预测分类模型。其中,PCA是一种常见的数据分析方式,常用于高维数据的降维,用于提取数据的主要特征分量,即用较少的指标代替和反映原始指标的主要信息。现有方案中在获取生物样本的拉曼光谱后,通过PCA对拉曼光谱数据进行降维,提取拉曼光谱数据中的主要信息,再构建SVM分类模型预测后续的生物样本拉曼光谱。
上述方法中的降维与分类以拉曼光谱中数个单独特征拉曼峰的强度作为依据,适合检测组分较为简单的物质。而由于尿液、血液和生物组织等生物样本成分极其复杂,拉曼峰位会因为各类原因而产生轻微偏移,使用该方法会影响预测分类模型的分类效果,也即上述预测分类模型的分类准确率较低。
发明内容
本发明的目的在于提供一种生物样本分类方法、装置和存储介质,用于解决现有技术中存在的问题。
为达到上述目的,本发明提供如下技术方案:
根据第一方面,本发明实施例提供了一种生物样本分类方法,所述方法包括:
对于n类生物样本集中的每一类,获取所述生物样本集中的每个生物样本的平均拉曼光谱,n为大于1的整数;
基于统计学方法,确定并存储每个平均拉曼光谱中具有差异的拉曼特征峰位;
获取每个具有差异的拉曼特征峰位的拉曼特征峰面积;
根据生成的各个拉曼特征峰面积训练分类预测网络,所述分类预测网络用于预测目标生物样本的分类。
可选地,所述确定并存储每个平均拉曼光谱中具有差异的拉曼特征峰位,包括:
对于每个平均拉曼光谱,根据所述平均拉曼光谱中的各个拉曼特征峰位峰强的中位值和/或均值检测所述拉曼特征峰位是否具有差异;
存储检测到的具有差异的拉曼特征峰位。
可选地,所述获取每个具有差异的拉曼特征峰位的拉曼特征峰面积,包括:
确定每个具有差异的拉曼特征峰位的拉曼特征峰散点数据;
根据各个拉曼特征峰散点数据生成所述拉曼特征峰面积。
可选地,所述确定每个具有差异的拉曼特征峰位的拉曼特征峰散点数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210841609.6/2.html,转载请声明来源钻瓜专利网。