[发明专利]单细胞表现型数据库系统和搜索引擎有效
申请号: | 201310105207.0 | 申请日: | 2013-03-29 |
公开(公告)号: | CN104077307B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 任立辉;宁康;籍月彤;王允;徐健;黄巍 | 申请(专利权)人: | 中国科学院青岛生物能源与过程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单细胞 表现型 数据库 系统 搜索引擎 | ||
技术领域
本发明涉及单细胞研究领域,具体的讲是通过新一代的细胞分选装备,得到单个或群体细胞(微生物、植物、动物或人体细胞均适用)的图像和拉曼光谱信息,从而为对这些细胞的组学分析、改造和利用奠定根本的基础。针对不同种类的单细胞建立的一种单细胞表现型数据库系统和搜索引擎,服务于单细胞研究与细胞科学应用领域。
背景技术
单个细胞是生命活动的基本单元,地球上所有生物均由单细胞构成或单细胞分化形成。对单细胞进行深入系统的研究不仅可以全景式地揭示生命活动的本质,而且单个细胞的特异性与分化过程对于研究疾病机理和诊断预防疾病等具有重要的意义。“单细胞研究”(针对特定功能的单个细胞的分析)将能够解析生命体系最“深”层次的运作机制,因此能够带来生命科学及其在能源、环境、健康、农业、海洋等广泛应用领域的突破。美国国家健康研究院(NIH)更是于2012年9月启动了“Single Cell Analysis Program”,公布了对26个项目总计9000万美元的资助,主要用于单细胞领域新工具、新技术的开发
(http://commonfund.nih.gov/singlecell/fundedresearch.aspx.)。2012年12月21日的Science杂志将单细胞研究推选为2013年最值得关注的六大科学领域之一。
细胞的表现型也就是细胞的表现形式,即利用整体观测手段可以获得的、反映细胞生长状态的信息。对于单细胞而言,表示它特定的物理外观或成分,如细胞形状、大小、颜色特征、纹理特征、类别等等,都是表现型的例子。其中重要的方法包括显微鉴定单细胞形态,以及利用拉曼光谱仪等设备得到的细胞拉曼光谱信号。对单细胞进行研究,也就是对细胞形状、大小、颜色等相关信息分析和细胞种类的判别,这些均需借助于一个包含不同细胞及不同生长周期的表现型数据库及对应的搜索引擎来实现。而现阶段在国内很少有相关的单细胞表现型数据库系统和基于单细胞表现型数据库的搜索引擎的研究,使得建立一套单细胞表现型数据库系统和搜索引擎对单细胞进行研究具有重要的实用价值。
发明内容
本发明开发了一种单细胞表现型数据库系统和搜索引擎的方法,收集不同种类单细胞样品,通过构建单细胞表现型数据库系统,借助搜索引擎手段,来对未知细胞种类进行判别。主要包括以下两个方面内容(以下以微藻样品为对象示例):
1.单细胞表现型数据库系统是获取细胞信息的主要途径,是细胞识别与筛选的重要依据。单细胞表现型数据库存将已数据标准化之后的所有已扫描过的细胞不同时间的拉曼光谱数据和细胞图像结构化存储,并存储相应数据所代表的细胞详细物种信息。此外,数据库提供高效率的数据库操作的应用程序接口(API),供其他软件模块调用(图1)。因此设计了可扩展、多层次的单细胞表现型数据库系统,其核心是两层数据库结构和相应的数据处理方法(图2)。其中,(1)初级数据库中存储来源于单细胞拉曼信号采集设备和单细胞图像采集设备的原始数据(Raw Data),并记录单细胞相关信息(图3)。(2)核心数据库中存储来源于原始数据的,通过归一化和质量控制处理的,具有特定类型物种代表性的单细胞数据。其中的归一化和质量控制通过拉曼图谱分析模块完成,分析模块通过对光谱信号和单细胞图像进行数据分析,从而筛选出具有代表性的单细胞数据并存入核心数据库中。而代表性单细胞数据的筛选,主要通过基于所有单细胞聚类分析中的组间差异和组内差异等分析来获得。通常对于特定物种特定环境特定采集时间的单细胞数据均选出代表性高质量数据存储于核心数据库中。(3)核心数据库的重要用途是服务于基于单细胞拉曼图谱和单细胞图像的比较和搜索。(4)核心数据库还将和NCBI、MG-RAST等通用或专业功能基因组数据库连接,支撑单细胞基因型和表观型的整合分析。如将核心数据库中的微藻单细胞表观型数据和NSBI中的微藻基因型数据进行整合,进行聚类分析、特征选取等数据挖掘分析。(5)最后,基于核心数据库的搜索和与功能基因组数据库的连接,设计一系列针对特定生物学问题的分析流程,支撑各类基于单细胞数据的研究。
2.基于单细胞表现型数据库的搜索引擎可以将某个未知细胞的拉曼光谱数据或细胞图像作为查询数据,通过比对整个单细胞表型数据库并找出最佳匹配细胞,从而获取此未知细胞的详细信息(图4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院青岛生物能源与过程研究所,未经中国科学院青岛生物能源与过程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310105207.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:加载资源文件的方法、设备和系统
- 下一篇:一种搜索引擎的结果排序方法及系统