[发明专利]一种基于特征基因的单细胞自动分类方法和装置有效
| 申请号: | 202011567060.3 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112837754B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 黄智豪;周祺;康博熙 | 申请(专利权)人: | 北京百奥智汇科技有限公司 |
| 主分类号: | G16B40/30 | 分类号: | G16B40/30;G16B40/00;G16B50/10;G16B30/00;G16B45/00 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 巩克栋 |
| 地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 基因 单细胞 自动 分类 方法 装置 | ||
本发明提供了一种基于特征基因的单细胞自动分类方法和装置,所述方法包括:将单细胞基因表达矩阵进行数据过滤、标准化和选择高变异基因后,进行降维处理和聚类处理,获得一个或多个细胞类群;采用负二项分布,从细胞类群中筛选特征基因集;将筛选的特征基因集与细胞类型数据库进行比对,采用超几何分布对比对结果进行检验统计,完成单细胞类型注释和单细胞自动分类。本发明的基于特征基因的单细胞自动分类方法AngryCell涵盖数据预处理、降维聚类、基于负二项分布的特征基因筛选、基于超几何分布的细胞类型匹配以及下游富集分析以及结果可视化等部分,获得的结果可靠准确、可解释性强。
技术领域
本发明属于单细胞测序技术领域,涉及一种基于特征基因的单细胞自动分类方法和装置。
背景技术
目前,主流的单细胞转录组数据分析流程的核心步骤包括:获取单细胞基因表达定量矩阵并进行降维处理,将同一批实验测到的所有细胞分为数个细胞类群,这一步骤即聚类(Clustering);接下来将各个细胞类群互相比较,找到每个细胞类群特征性高表达的基因,称为特征基因(Marker);再根据特征基因,预测每个细胞类群所属的细胞类型,并对每个细胞类群进行标注(Cluster annotation),标注的细胞数据用于科学问题的深度分析,这种对单细胞类群进行标注的过程称为单细胞分类。
单细胞分类在大部分单细胞数据分析过程中由人工完成。数据分析人员在获取特征基因后,通过查询数据库、文献或根据经验,对每个细胞类群的归属进行预测和判断。这一预测过程完全由人为判断,既耗时耗力,又受到操作者的经验限制,有时会出现错误。另外,由于人工行为不具有可重复性,往往导致结果的科学可靠性受到质疑。因此,近年来国际上逐步建立了单细胞数据的自动分类方法。已有的单细胞自动分类方法有两种思路:一种基于参考数据,一种基于参考基因集。
基于参考数据的自动分类方法包括SingleR(Aran D,Looney AP,Liu L,etal.Reference-based analysis of lung single-cell sequencing reveals atransitional profibrotic macrophage[J].Nature immunology,2019,20(2):163-172.)、SCMAP(Kiselev V Y,Yiu A,Hemberg M.scmap:projection of single-cell RNA-seq data across data sets[J].Nature methods,2018,15(5):359-362.)和SciBet(LiC,Liu B,Kang B,et al.SciBet as a portable and fast single cell typeidentifier[J].Nature communications,2020,11(1):1-8.)等。该方法使用人工标注的单细胞数据作为参考,进行模型拟合,再利用拟合的模型对新的单细胞数据进行预测,可以归类为使用机器学习的方法。基于参考数据的自动分类方法既可以对单个细胞进行预测,也可以对聚类产生的细胞类群进行预测。
基于参考基因集的自动分类方法目前仅有Garnett(Pliner H A,Shendure J,Trapnell C.Supervised classification enables rapid annotation of cell atlases[J].Nature methods,2019,16(10):983-986.)一种。它的原理是使用人工定义的各种细胞类型的特征基因集,先在待检测的单细胞数据中寻找符合特征基因定义的阳性细胞,再使用阳性细胞拟合模型,对剩下的单细胞数据进行预测,这一方法也归类于机器学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百奥智汇科技有限公司,未经北京百奥智汇科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567060.3/2.html,转载请声明来源钻瓜专利网。





