[发明专利]一种利用三维荧光光谱特征信息对污染水体溯源分类识别的方法有效

专利信息
申请号: 202010350110.6 申请日: 2020-04-28
公开(公告)号: CN111426668B 公开(公告)日: 2023-09-08
发明(设计)人: 杨宇红;王欣;高贝贝;何鹰;魏峨尊 申请(专利权)人: 华夏安健物联科技(青岛)有限公司
主分类号: G01N21/64 分类号: G01N21/64
代理公司: 山东诚功律师事务所 37242 代理人: 封代臣
地址: 266555 山东省青岛市黄岛区保*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 三维 荧光 光谱 特征 信息 污染 水体 溯源 分类 识别 方法
【权利要求书】:

1.一种利用三维荧光光谱特征信息对污染水体溯源分类识别的方法,其特征在于,包括如下步骤:

(1)信息调查:确定污水排放企业名称及所属行业、地理位置、产品生产工艺、联系人;

(2)样品采集与扫描:对采集的污染排放源的废水样品进行编号,用0.45微米滤膜过滤后上机扫描,获取其荧光光谱;对扫描后的污水样本进行稀释,再次扫描并获取其荧光光谱,样本的稀释倍数,按荧光峰强度的高低设置自动稀释;

(3)数据处理:将上机扫描获得的荧光光谱数据消除瑞利散射、拉曼散射干扰,得到基本荧光光谱,将各个样本基本荧光光谱数据分别构建为发射波长—激发波长—荧光强度数据矩阵;

(4)数据库:用数据处理得到的各个样本数据矩阵组成基本荧光光谱数据库,从基本荧光光谱数据库中的光谱数据提取特征信息,根据特征信息属性分为峰特征数据、平面特征数据和立体特征数据,并根据特征信息属性构建峰特征数据库、平面特征数据库和立体特征数据库;

所述的峰特征数据库包括单峰库、双峰库、三峰库和四峰库;峰特征数据库中样本荧光峰为单峰的,由发射波长EM11和激发波长EX11组成;峰特征数据库中样本荧光峰为双峰的,由发射波长EM21、激发波长EX21、发射波长EM22和激发波长EX22组成;峰特征数据库中样本荧光峰为三峰的,由发射波长EM31、激发波长EX31、发射波长EM32、激发波长EX32、发射波长EM33和激发波长EX33组成,四峰库以此类推;

所述的平面特征数据库包括从荧光光谱特征信息中提取荧光峰Fp的荧光强度值Qp,由该荧光强度值Qp获得的发射波长EMp、激发波长EXp构成峰中心坐标(EMp,EXp),按样本荧光峰数目计算该样本的平面特征,所述的平面特征包括峰强度比、单个峰的半峰宽、峰间距、峰峰连线与x轴间的夹角及四峰连线形成的三角形内角和各边斜率,计算时需要将不同量纲的荧光强度值Qp、发射波长EMp和激发波长EXp进行归一化后进行,归一化的方法包括将(EMp,EXp,Qp)转换为(x,y,z);

峰坐标由峰荧光强度值Qp、发射波长EMp和激发波长EXp构成;

对于单峰,从荧光光谱特征信息中提取荧光峰Fp11的荧光强度值Qp11、由发射波长EMp和激发波长EXp构成峰中心坐标Fp11(x1,y1);

取峰Fp11荧光强度值Qp11的一半时的发射波长值作为半峰宽坐标计算发射波长的变化|x1’-x1|,并由此计算点Fp11(x1,z1)、和组成的三角形面积,计算各边长度,计算斜边与x轴的夹角α、计算斜边Fp11(x1,z1)和连线的斜率k;

对于双峰,从荧光光谱特征信息提取荧光峰Fp21和Fp22,其荧光强度值分别为Qp21和Qp22、由发射波长EMp和激发波长EXp构成峰中心坐标分别为Fp21(x1,y1)和Fp22(x2,y2),计算两荧光峰荧光强度值比Qp21/Qp22,计算两荧光峰中心坐标Fp21(x1,y1)和Fp22(x2,y2)之间的距离|Fp21Fp22|,并由此计算点Fp21(x1,y1)、Fp22(x2,y2)和p(x2,y1)组成的三角形面积,p(x2,y1)为水平穿过点Fp21(x1,y1)的直线与垂直穿过点Fp22(x2,y2)的直线的交点,计算三角形三个内角,计算Fp21(x1,y1)和Fp22(x2,y2)连线的斜率k’;

对于三峰,从荧光光谱特征信息提取荧光峰Fp31、Fp32和Fp33,其荧光强度值由大到小排列分别为Qp31、Qp32和Qp33,由发射波长EMp和激发波长EXp构成峰中心坐标分别为Fp31(x1,y1)、Fp32(x2,y2)和Fp33(x3,y3),计算两两荧光峰荧光强度值比Qp31/Qp32、Qp31/Qp33、Qp32/Qp33,计算两两荧光峰中心坐标之间的距离|Fp31Fp32|、|Fp31Fp33|、|Fp32Fp33|,计算三角形Fp31Fp32Fp33面积、三角形的三个内角α’、β’和θ’,三条边的斜率k1、k2和k3;

对于四峰,就是荧光峰有四个的样本,从荧光光谱特征信息提取荧光峰Fp41、Fp42、Fp43和Fp44,按荧光峰荧光强度值由大到小排列Qp41、Qp42、Qp43和Qp44,由发射波长和激发波长构成峰中心坐标,计算两两荧光峰强度比Qp41/Qp42、Qp41/Qp43、Qp41/Qp44、Qp42/Qp43、Qp42/Qp44、Qp43/Qp44,计算两两荧光峰中心坐标之间的距离|Fp41Fp42|、|Fp41Fp43|、|Fp41Fp44|、|Fp42Fp43|、|Fp42Fp44|和|Fp43Fp44|,分别计算三角形Fp41Fp42Fp43和Fp41Fp43Fp44的面积、计算三角形Fp41Fp42Fp43的内角α”、β”、θ”,计算三角形Fp41Fp43Fp44的内角σ、λ、ω,计算线段Fp41Fp42、Fp41Fp43、Fp41Fp44斜率k1’、k2’和k3’,

所述的立体特征数据库包括从荧光光谱特征信息中提取荧光峰Fl的强度值Ql,由该强度值Ql获得由发射波长EMl、激发波长EXl构成的峰坐标(EMl,EXl,Ql)和峰中心坐标(EMl,EXl),按样本荧光峰数目计算该样本的立体特征,所述的立体特征包括立方体的体积,计算时需要将不同量纲的荧光强度值Ql、发射波长EMl和激发波长EXl进行归一化后进行,归一化的方法包括将(EMl,EXl,Ql)转换为(x,y,z);

对于单峰,从荧光光谱特征信息中提取荧光峰Fl11的荧光强度值Ql11、由发射波长EMl和激发波长EXl构成峰中心坐标Fl11(x1,y1),由发射波长EMl、激发波长EXl和荧光强度值Ql构成荧光峰坐标Fl11(x1,y1,z1);

取峰Fl11荧光强度值Ql11的一半时的发射波长值作为半峰宽坐标;计算发射波长的变化(x1’-x1),以此作为圆锥的半径,结合已知荧光峰荧光强度值Ql11,计算圆锥的体积Vl11;

对于双峰,从荧光光谱特征信息中提取荧光峰Fl21和Fl22,其荧光强度值由大到小排列分别为Ql21和Ql22、由发射波长EMl和激发波长EXl构成峰中心坐标分别为Fl21(x1,y1)和Fl22(x2,y2),由发射波长EMl、激发波长EXl和荧光强度值Ql构成荧光峰坐标分别为Fl21(x1,y1,z1)和Fl22(x2,y2,z2);计算最大荧光峰荧光强度值Ql21的半峰宽及坐标,就是当Ql21值由z1变成0.5z1时,半峰高坐标为发射波长的变化|x1’-x1|,就是半峰宽坐标为根据4个空间坐标Fl21(x1,y1,z1)、Fl22(x2,y2,z2)、和组成一个四面体,该四面体有4个面,6条棱,4个顶点,由此获得组成该四面体的空间结构各项参数,包括计算该四面体的6个棱的边长、6个二面角,计算该四面体的4个三面角、4个三角形面积,计算该四面体的体积;

对于三峰,从荧光光谱特征信息中提取荧光峰Fl31、Fl32和Fl33,其荧光强度值由大到小排列分别为Ql31、Ql32和Ql33、由发射波长EMl和激发波长EXl构成峰中心坐标分别为Fl31(x1,y1)、Fl32(x2,y2)和Fl33(x3,y3),分别用a’、b’和c’表示;由发射波长EMl、激发波长EXl和荧光强度值Ql构成荧光峰坐标分别为Fl31(x1,y1,z1)、Fl32(x2,y2,z2)和Fl33(x3,y3,z3),分别用a、b和c表示;将坐标a、b和c相连组成的三角形与坐标a’、b’和c’相连组成的三角形相连组成一个五面体,该五面体看作由两个三角形abc和a’b’c’、三个四边形aa’b’b、aa’c’c和bb’c’c组成;该五面体由一个截面分拆为一个四面体和一个下底面为四边形的四棱锥,计算四面体和四棱锥的体积;

对于四峰,从荧光光谱特征信息中提取荧光峰Fl41、Fl42、Fl43和Fl44,其荧光强度值由大到小排列分别为Ql41、Ql42、Ql43和Ql44,由发射波长EMl和激发波长EXl构成峰中心坐标分别为Fl41(x1,y1)、Fl42(x2,y2)、Fl43(x3,y3)和Fl44(x4,y4),分别以a0’、b0’、c0’和d0’表示;由发射波长EMl、激发波长EXl和荧光强度值Ql构成荧光峰坐标分别为Fl41(x1,y1,z1)、Fl42(x2,y2,z2)、Fl43(x3,y3,z3)和Fl44(x4,y4,z4),以a0、b0、c0和d0表示;将峰坐标点Fl41(x1,y1,z1)、Fl42(x2,y2,z2)、Fl43(x3,y3,z3)与峰中心坐标点Fl41(x1,y1)、Fl42(x2,y2)、Fl43(x3,y3)相连组成一个多面体,Fl41(x1,y1,z1)、Fl43(x3,y3,z3)、Fl44(x4,y4,z4)与峰中心坐标点Fl41(x1,y1)、Fl43(x3,y3)、Fl44(x4,y4)相连组成另一个多面体;就是把由四峰组成的多面体拆分为两个小的多面体;

对于上述四峰拆分的两个多面体的处理方法与三峰形成的一个多面体的处理方法一样,首先把多面体拆分为一个四面体和一个四棱锥,然后分别对四面体和四棱锥的体积进行计算;

(5)聚类:根据特征荧光光谱库中的单峰、双峰、三峰以及四峰数据,分别使用K-means算法进行聚类;

对于单峰,将所有N1个单峰样本的峰中心坐标,发射波长和激发波长组成单峰特征数据库,设定类别K1的数目K1=N1,用K-means算法通过反复迭代运算,逐步降低目标函数的误差值,求得满足方差最小标准的K1个聚类,这个聚类结果被当作单峰类聚类结果;

对于双峰,将所有N2个双峰样本的峰中心坐标,按峰强度高低排列,峰F1的强度大于峰F2的强度,峰F1发射波长、激发波长和峰F2发射波长、激发波长组成双峰特征数据库,设定类别K2的数目K2=N2,用K-means算法通过反复迭代运算,逐步降低目标函数的误差值,求得满足方差最小标准的K2个聚类,这个聚类结果被当作双峰类聚类结果;

多于双峰的情况参照上述处理方法,获得三峰或四峰聚类结果;

(6)分类:在获得聚类结果的基础上,将聚类结果引入神经网络模式层构建概率神经网络,就是PNN神经网络,该PNN神经网络分为4层:

第一层输入层,将特征向量传入网络,输入层个数就是样本特征的个数,以样本荧光峰数目为特征,以单峰、双峰、三峰或四峰的发射波长和激发波长为特征向量;

第二层模式层,计算输入特征向量与训练集中各个模式的匹配程度,也就是相似度,将其距离送入高斯函数得到模式层的输出,模式层神经元的个数是输入样本矢量的个数,也就是有多少个样本,该层就有多少个神经元,该模式层是样本通过K-means算法聚类得到的;

第三层求和层,将各个类的模式层单元连接起来,这一层的神经元个数是样本的类别数目,就是用K-means算法得到的类别;

第四层输出层,输出求和层根据各类对输入向量概率的估计,采用Bayes分类规则,选择具有最小“风险”的类别,就是具有最大后验概率的类别,作为得分最高的那一类输出;

(7)识别比对:对未知企业污水样本在获取三维荧光光谱数据后,经过与上述过程相同的数据处理计算,得到峰特征数据、平面特征数据和立体特征数据,用已构建好的PNN神经网络,对未知企业污水样本峰特征数据进行概率神经网络预测分类,获得该样本的分类结果,由于该分类样本中荧光峰特征信息相似,必须通过其它特征信息的相似性比对计算,才能获得最终的未知企业与疑似企业污水识别比对的结果,因此将该类别中所有已知样本的基本荧光光谱数据,特征光谱数据纳入比对识别库中,借助于相似性比对计算,获得未知样本与同类别中所有已知样本的相似性匹配度,将所有相似匹配项的得分值相加,得分最高者为两个样本最佳匹配,获得未知样本的疑似溯源信息,所述的其它特征信息的相似性比对计算包括利用基本荧光光谱数据、峰特征数据、平面特征数据和立体特征数据构建的数据矩阵,进行余弦相似性、Peason系数的计算。

2.根据权利要求1所述利用三维荧光光谱特征信息对污染水体溯源分类识别的方法,其特征在于:在步骤(6)中,PNN神经网络构建完成后,通过不断增加样本训练和验证,确保分类结果的可靠,当输出层把最大后验概率的类别输出后,如果其输出结果与K-means算法给定的训练结果不一致,需要人为调整该样本在模式层的类别位置,以适应PNN的预测,不断地进行这样的调整,以使所有的样本经PNN网络训练后误差最小,经过这样处理后的PNN神经网络能对未知样本进行分类判别了;

PNN神经网络的构建根据需要做适当调整,在输入层增加峰强度值、峰强度比特征向量与荧光峰数目共同组成新的输入层,当训练样本的期望输出与PNN网络的仿真输出完全重合时,说明网络训练成功,可用来预测未知样本的类别,平滑因子选定为1.5-5。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华夏安健物联科技(青岛)有限公司,未经华夏安健物联科技(青岛)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010350110.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top