[发明专利]应用计算机技术管理、合成、可视化和探索大型多参数数据集的参数在审
申请号: | 201780069990.6 | 申请日: | 2017-12-13 |
公开(公告)号: | CN109937358A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 詹姆斯·阿尔玛罗德;约瑟夫·斯皮德伦;迈克尔·大卫·斯塔德尼斯凯 | 申请(专利权)人: | 佛罗乔有限责任公司 |
主分类号: | G01N15/14 | 分类号: | G01N15/14;G01N33/53;G01N33/48;C12N15/10;C12N5/071;C12Q1/68 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陆建萍;杨明钊 |
地址: | 美国俄*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 多参数 应用计算机技术 关联数据结构 基因表达数据 细胞基因表达 计算机技术 可视化技术 细胞 基因集合 用户关注 数据处理 基因 可视化 散点图 细胞群 新关系 迭代 合成 创建 应用 探索 发现 管理 | ||
公开了计算机技术,其将创新的数据处理和可视化技术应用于诸如细胞基因表达数据的大型多参数数据集,以发现诸如细胞和基因之间的关系的新关系,并在代表这些关系的数据集内创建新的关联数据结构。例如,基因表达数据的散点图可以在细胞视图和基因视图之间迭代地旋转,以找到用户关注的细胞群和基因集合。
相关专利申请的交叉引用和优先权要求
本专利申请要求于2016年12月14日提交的序列号为62/433,930并且标题为“Applied Computer Technology for Management,Synthesis,Visualization,andExploration of Parameters in Large Multi-Parameter Data Sets”的美国临时专利申请的优先权,其全部公开内容通过引用并入本文。
引言
可用于大量人群和各个细胞的大量的遗传和基因表达信息已经增长到了对于调查人员来说变得难以控制(unwieldy)的程度。例如,细胞基因表达(gene expression)数据可以包括成千上万个基因(例如,10,000-30,000个或更多个基因)的基因表达数据,现在可以针对各个细胞进行测量,并且每个样本可以测量成千上万个细胞。这在细胞基因表达数据的可视化、分析、探索和理解领域提出了一个巨大的技术问题。
例如,对于使用计算机来促进细胞基因表达数据可视化的传统方法,可视化是最终的终点,并且作为用户使用R编程语言手动编写脚本的结果,得出可视化,这要求用户具有不同库的知识,以便执行数据输入、重新格式化、操作、计算和绘图。这些脚本通常必须针对特定的数据集进行定制,并且它们的创建需要对编程语言、现有库以及用于产生结果所需的输入的专门知识。此外,这种常规方法阻碍了对异质细胞群(cell population)的深入探索。
作为该技术问题的解决方案,发明人公开了计算机技术的应用,其使用遍及细胞表达数据的各个维度的创新的散点图(scatterplot)显示,包括细胞(或细胞群)视图散点图,其中细胞被可视化为各个数据点(例如,细胞的基因相对于基因散点图的关系),以及基因视图散点图,其中,基因被可视化为各个数据点(例如,基因的细胞群相对于细胞群散点图的关系)。可以在这些散点图中执行门控(gate),以分别创建细胞群和基因集合,这些细胞群和基因集合可以充当生物学相关的维度,而被添加到工作区中作为新的数据对象,以用于扩充(augment)细胞基因表达数据,并且为有意义的调查开辟新的途径。作为对比,基于各个基因,以隔离的、孤立的方式进行这种分析很快变得难以控制,而在细胞视图散点图和基因视图散点图之间旋转(pivot)的能力允许用户找到生物学相关的基因分组,然后可以将其作为细胞视图散点图的合成(synthetic)参数进行进一步研究。
如上所述,对于本领域的传统的可视化系统,可视化充当过程中的终点,而不能充当进一步创建用于进一步研究的进一步可视化细化(refinements)的起点。作为示例,来自转移性黑色素瘤患者的免疫细胞样本可以包含T细胞,并且本领域的传统可视化系统将只能识别免疫细胞内的该亚群(subset)。然而,本文描述的创新计算机系统允许对T细胞亚群进行深入的探索和分析,以识别这些T细胞内的多个亚群,例如“耗尽(exhausted)”的T细胞,跟踪这种状态到各个基因,然后这些基因可以被靶向以逆转这种耗尽,激活T细胞,从而可能刺激免疫反应以根除转移,如下面参考示例实施例更详细解释的。
因此,通过本文描述的创新可视化技术,计算机技术可以应用于细胞基因表达数据,以发现细胞和基因之间的新关系,并在代表这些关系的细胞基因表达数据内创建新的关联数据结构。
通过这些和其他特征,本发明的示例实施例在应用生物信息学领域提供了显著的技术进步。
附图简述
图1公开了一个示例计算机系统,其可以用于支持本文描述的创新数据处理和可视化技术。
图2A描绘了细胞基因表达数据集的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛罗乔有限责任公司,未经佛罗乔有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780069990.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分析溶剂分子在聚合物材料中的扩散系数的方法
- 下一篇:场景上的气体的检测