[发明专利]一种多参数流式数据自动分群方法在审
申请号: | 201910204433.1 | 申请日: | 2019-03-18 |
公开(公告)号: | CN110197193A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 孟晓辰;祝连庆;娄小平;董明利;于明鑫;刘锋;宋言明 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/00 |
代理公司: | 北京市科名专利代理事务所(特殊普通合伙) 11468 | 代理人: | 陈朝阳 |
地址: | 100085 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多参数 矩阵 流式数据 成分参数 困惑度 低维 分群 降维 迭代结束 迭代寻优 计算条件 矩阵数据 聚类质心 数据分群 随机选取 损失函数 循环迭代 样本矩阵 初始化 固定的 概率 聚类 算法 维数 质心 更新 联合 | ||
一种多参数流式数据自动分群方法,包括如下步骤:步骤一:基于t‑SNE的多参数数据分群:输入待降维多参数流式数据,设定需要降到的维数d以及损失函数参数困惑度;对样本矩阵X进行初始化,计算相应矩阵之间的距离,使用固定的困惑度计算条件概率pj|i;进入循环迭代:计算低维度下的联合概率,计算梯度;迭代寻优,更新低维数据,迭代结束后得到的矩阵即为降维后的主成分参数矩阵;步骤二:将主成分参数矩阵数据使用K‑means算法聚类:随机选取个聚类质心点作为初始质心。
技术领域
本发明涉及一种流式细胞仪检测人体外周血细胞并对血细胞多参数数据进行快速自动分群的方法,属于生物医学检测领域。
技术背景
流式细胞术(flow cytometry)是一种能够对悬浮的细胞或者其他微粒进行多参数、快速分析或分选的技术。随着医学领域的发展,疾病的诊断越来越深入,流式细胞仪能够检测的参数也成倍增加,对多参数流式细胞数据进行快速、准确的分析是提高临床诊断效率的关键。流式细胞仪包括光学系统、流动室及液流驱动系统、光电检测系统和信号处理系统四大部分,其中,信号处理系统的一部分工作是要对大量多色多参数流式数据进行分析,分析难度大,传统对多色流式数据分析的方法是根据细胞的散射光或荧光的特性,使用专用软件采用人工设门的方法,分析的过程是根据经验选取两组荧光信号特征参数作为横纵坐标,绘制二维散点图,在图中划定目标细胞类型的区域范围进行分析,但随着细胞参数的增多,传统人工设门的方法已无法人们临床检测的需要,其主要存在以下问题:
(1)人工设门缺乏客观性。专家凭借自身经验从多种荧光特征中选取两个绘制散点图,且圈门和做出细胞类群的判断也因人而异,没有量化标准。
(2)分析结果可重复性差。针对不同的数据,人工设门方法并没有标准统一的画法。
(3)需要操作者有专业背景。流式数据分析软件是流式细胞仪专用软件,涉及到的医学知识是一般使用者不具备的,存在局限性。
(4)对多维数据间的特征差异无法进行准确识别。数据分析只能显示二维特征,并寻找差异,而多色多参数高维流式数据的特征只能在多维空间才能显示出来。
(5)过程繁琐、效率低、资源浪费巨大。人工分析过程不仅消耗人力,浪费时间,而且分析结果往往可靠性差。
针对人工设门存在的缺点,一些专家学者对流式细胞数据的自动分析方法进行了探索,但是大多是研究对细胞自动聚类的方法,很少有考虑到细胞类群的分布状态。例如,最早用于流式细胞自动分群的方法K-means算法,通过计算样本点间的欧氏距离划分样本数据,实现聚类;Sugar和Sealfon提出了基于渗透理论的非监督密度轮廓聚类算法(unsupervised density contour clustering algorithm),通过构建样本数据直方图寻找数据峰,实现了流式数据中多种形状细胞类群的快速聚类分析;Qian等人提出了基于网格划分和合并(grid-based partitioning and merging)类群识别算法,该算法依据数据密度特征识别二维数据中不规则分布的类群细胞;Aghae等提出基于层次聚类思想;还有高斯混合模型等。
发明内容
本发明针对呈非对称且有拖尾分布的细胞类群,提出了一种基于流行学习的t分布邻域嵌入算法(t-SNE)的多参数流式数据进行自动分群方法。
本专利的目的是通过下述技术方案实现的。
一种多参数流式数据自动分群方法,其特征在于,包括如下步骤:
步骤一:基于t-SNE的多参数数据分群:
输入待降维多参数流式数据,设定需要降到的维数d以及损失函数参数困惑度;
对样本矩阵X进行初始化,计算相应矩阵之间的距离,使用固定的困惑度计算条件概率pj|i;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910204433.1/2.html,转载请声明来源钻瓜专利网。