[发明专利]一种降低单细胞转录组数据中技术噪声的方法有效
| 申请号: | 201810828849.6 | 申请日: | 2018-07-25 |
| 公开(公告)号: | CN109033743B | 公开(公告)日: | 2021-01-01 |
| 发明(设计)人: | 郝洁;邹欣;韩泽广 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/20;G16B50/00 |
| 代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 降低 单细胞 转录 数据 技术 噪声 方法 | ||
本发明公开了一种降低单细胞转录组数据中技术噪声的方法,包括以下步骤:步骤一,根据单细胞转录组数据获取每个基因表达的平均方差;步骤二,根据所述每个基因表达的平均方差构建卡方分布模型并使用所述卡方分布模型计算多个候选阈值;步骤三,计算使用每个所述候选阈值时所得到的有效特征向量的个数;步骤四,基于所述有效特征向量的个数判定基因滤除的最优阈值;步骤五,基于所述最优阈值进行基因滤除。本发明的降低单细胞转录组数据中技术噪声的方法,可以平衡单细胞转录组数据预处理中控制残留噪声和减小信息损失之间的矛盾,并且基于统计最优化原则降低噪声,摒除人为干扰因素,显著提高了单细胞数据解读的可靠性。
技术领域
本发明涉及单细胞数据处理领域,尤其涉及一种降低单细胞转录组数据中技术噪声的方法。
背景技术
单细胞转录组数据中存在大量的技术噪音。这些技术噪音的来源复杂,随机性强,可能会极大的影响数据的解读。因此,单细胞数据解读的第一步往往是滤除掉技术噪声污染基因。已有的降低技术噪音的方法主要有两种,一是通过人工设定的硬阈值来滤除基因,比如Martinez-Jimenez(Martinez-Jimenez,C.P.,et al.“Aging increases cell-to-cell transcriptional variability upon immune stimulation(衰老增加免疫刺激后细胞间转录的变异性)”Science 355,1433-1436,2017)、Treutlein(Treutlein,B.,et al.“Reconstructing lineage hierarchies of the distal lung epithelium usingsingle-cell RNA-seq(使用单细胞RNA-seq重建远端肺上皮的谱系层次)”Nature 509,371-375,2014)以及Usoskin(Usoskin,D.,et al.“Unbiased classification of sensoryneuron types by large-scale single-cell RNA sequencing(通过大规模单细胞RNA测序对感觉神经元类型进行无偏分类)”Nature neuroscience 18,145-153,2015)均使用了人工设定的硬阈值进行基因滤除;另一种是通过回归方法计算阈值并滤除基因,比如Zeisel(Zeisel,A.,et al.“Cell types in the mouse cortex and hippocampusrevealed by single-cell RNA-seq(通过单细胞RNA-seq显示小鼠皮层和海马体中的细胞类型)”Science 347,1138-1142,2015)。但是,已有的方法都缺乏一个客观的评价标准,因而基因滤除的结果中有可能仍然包含大量的残留噪声或者有价值的生物学信息被错误地滤除。
因此,本领域的技术人员致力于开发一种可靠的降低单细胞转录组数据中技术噪声的方法,摒除人为干扰因素,提高单细胞数据解读的可靠性。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种比较客观的方法来判定滤除单细胞转录组数据中技术噪声的阈值,减少基因滤除的结果中的残留噪声,并保留有价值的生物学信息不被错误地滤除。
为实现上述目的,本发明提供了一种降低单细胞转录组数据中技术噪声的方法,包括以下步骤:
步骤一,根据单细胞转录组数据获取每个基因表达的平均方差;
步骤二,根据所述每个基因表达的平均方差构建卡方分布模型并使用所述卡方分布模型计算多个候选阈值;
步骤三,计算使用每个所述候选阈值时所得到的有效特征向量的个数;
步骤四,基于所述有效特征向量的个数判定基因滤除的最优阈值;
步骤五,基于所述最优阈值进行基因滤除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810828849.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





