[发明专利]单细胞转录组数据伪时间轨迹的分析方法及计算机系统在审
| 申请号: | 202210279806.3 | 申请日: | 2022-03-21 |
| 公开(公告)号: | CN114613433A | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 卢雨儿;林海;胡桓;戚德振;刘东东;杨国钰;邱野;帅建伟 | 申请(专利权)人: | 国科温州研究院(温州生物材料与工程研究所) |
| 主分类号: | G16B25/10 | 分类号: | G16B25/10 |
| 代理公司: | 温州金瓯专利事务所(普通合伙) 33237 | 代理人: | 陈晖 |
| 地址: | 325000 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 单细胞 转录 数据 时间 轨迹 分析 方法 计算机系统 | ||
本发明公开了一种单细胞转录组数据伪时间轨迹的分析方法及计算机系统,其包括:1)计算基因显式比较优势矩阵;2)利用相似度得到基因相识度矩阵,构建基因网络;3)在基因网络中取初始节点,并从初始节点开始随机行走,记录走过的每一个基因,形成由基因序列构成的基因文本;4)将基因文本转换成基因的词向量;5)将单细胞表达的基因矢量以表达量为权重加和,形成的和矢量作为该单细胞在基因空间中的词向量表示;6)将所有的细胞的矢量表示进行可视化处理,得到胚胎细胞发育伪时间轨迹结果。本发明为鉴别组织中不同的稀有细胞亚型和不同细胞亚型的变异基因提供分析基础,在肿瘤、发育生物学、生命科学等领域有广泛重要的应用前景。
技术领域
本发明具体涉及一种单细胞转录组数据伪时间轨迹的分析方法及计算机系统。
背景技术
2009年发明的单细胞转录组测序技术,是近十年来迅速发展的生命科学前沿技术。单细胞转录组测序是指对于单个细胞水平上将mRNA反转录扩增后进行高通量测序的技术,从单细胞水平揭示了细胞基因排列结构和基因表达状态,为生命科学的研究提供了独特的视角。该技术能够允许同时对上千上万个单细胞进行转录组分析,从单细胞转录组分辨率水平上提供了对细胞类型的鉴定,并使我们可以从转录组水平对组织中细胞异质性和复杂性进行详细分析,为科学家研究单个细胞的行为、机制等提供了强有力的新方法。单细胞测序技术在肿瘤、发育生物学、微生物学、神经科学等领域发挥着越来越重要的作用,成为了当今生命科学极具潜力的热点研究领域。
根据单细胞转录组测序数据,我们可以对其进行细胞变化轨迹分析,讨论在细胞发育演化过程中,祖源细胞沿着某个特定过程,由于基因突变等因素,发生单个或多个发育轨迹分化和命运变化。当细胞从一种基因序列状态转换到另一种序列状态时,所发生的基因变异大小程度,可以用伪时间指数来度量,从而可以用伪时间来衡量单个细胞在细胞分化过程中发生了多大的进展和变化。
在过去的几年中,已经开发了各种不同的伪时间轨迹分析方法,例如PAGA、DTFLOW、VIA和Palantir等。PAGA是基于分区的图抽象方法,该方法在估计流形分区连通性的基础上,构建了流形数据的可解释类图映射,该映射保留了数据的全局拓扑,允许以不同的分辨率分析数据,从而提高了数据分析工作的计算效率。PAGA是一种易于解释的拓扑数据分析方法,为了分析单细胞基因动力学,PAGA将基于随机游走的距离测度扩展到考虑不连通图的情况,通过追踪抽象图中高置信度路径,及该路径中细胞与祖细胞的距离排序,从而分析基因变化大小构建伪时间轨迹。
DTFLOW方法针对原始的单细胞基因表达数据,首先基于欧氏距离计算每个细胞的k个近邻点,得到一个近邻图。然后根据需要构建一个高斯核函数矩阵,将细胞间的欧氏距离转化为高斯核权重来表示细胞间的相似性。通过重启随机游走算法,将每个数据点转换为一个离散分布,并得到扩散矩阵。接着又通过不同分布之间的巴氏系数构建一个巴氏核矩阵,然后使用低维数据集来可视化原始高维单细胞数据集的底层结构,根据根单元格对应的矩阵进行伪时间轨迹计算。
VIA是在前人随机游走模型的基础上,创新性的提出了将暂停-跳转效应(lazy-teleporting behavior)加入到模型中的一种分析方法。VIA模型中的暂停-跳转随机游走,允许具有预定义的暂停状态(保留在原节点/状态)和跳转状态(跳转到任何其他节点/状态)。该方法考虑随机行走的暂停行为(lazy),即每个节点具有(1-)几率的惰性概率停留在原来位置,然后通过考虑在集群图上的随机游走,对数据集进行可扩展的伪时间计算。
Palantir方法利用相邻图和伪时间构造了一个马尔可夫链,它将细胞分化考虑化为一个随机过程,其中一个细胞通过流形中的一系列步骤达到一个或多个终端状态。伪时间提供方向性,以与顺序一致的方式定位邻居图中的边。对于每个有向边,计算分配到达邻近单元的一个步骤的跃迁概率。通过多个步骤计算到达较远单元的概率,如果有多条路径连接它们,概率就会很高,即观测到的中间单元状态密度很高。这样通过每一步随机行走,在更长的距离上流形图结构给出了伪时间轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国科温州研究院(温州生物材料与工程研究所),未经国科温州研究院(温州生物材料与工程研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210279806.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动交接纬纱的纺织系统
- 下一篇:一种电磁驱动的超宽门幅电磁引纬系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





