[发明专利]一种基因大肠杆菌表达谱芯片的基因网络构建方法无效
申请号: | 201110407359.7 | 申请日: | 2011-12-09 |
公开(公告)号: | CN103164634A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 曾华宗 | 申请(专利权)人: | 上海聚类生物科技有限公司 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 大肠杆菌 表达 芯片 网络 构建 方法 | ||
技术领域
本发明属于生物技术领域,涉及一种基于大肠杆菌表达谱芯片的基因网路构建及进行基因之间相互作用关系研究的方法。
背景技术
基因芯片的原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法。在一块基片表面固定了序列已知的八核苷酸的探针。当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。
基因是编码蛋白质或RNA(核糖核酸)等具有特定功能产物的遗传信息的基本单位,是染色体或基因组的一段DNA(脱氧核糖核酸)序列,对以RNA作为遗传信息载体的RNA病毒而言,基因则是RNA序列。包括编码序列(外显子)、编码区前后对于基因表达具有调控功能的序列和单个编码序列间的间隔序列(内含子)。从生物进化的角度来讲,基因又称为遗传因子,它是生物遗传变异的物质基础,是DNA(或RNA)分子上具有遗传信息的特定核苷酸序列的总称,是具有遗传效应的DNA(或RNA)分子片段。基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。人类大约有几万个基因,储存着生命孕育生长、凋亡过程的全部信息,通过复制、表达、修复,完成生命繁衍、细胞分裂和蛋白质合成等重要生理过程。基因是生命的密码,记录和传递着遗传信息。生物体的生、长、病、老、死等一切生命现象都与基因有关。它同时也 决定着人体健康的内在因素,与人类的健康密切相关。
基因存在于生物体内的功能之一便是翻译蛋白质,通过蛋白质活性的表现,决定生物体的表型。换而言之,生物的各种性状几乎都是基因之间相互作用、调控各个基因表达的结果。所谓基因之间的相互作用,是指不同基因之间存在的表达调控关系,一般都是一个基因的表达产物作用于另一个基因,影响另一个基因的转录、翻译等过程。
为研究基因之间相互作用关系,本发明所述方法引入了一种基于大肠杆菌表达谱芯片的数据分析处理,通过对大肠杆菌基因芯片的数据分析处理,找到了一种构建基因网络间的构建方法,通过对芯片产出数据的分析处理及对差异表达基因的网络构建,可了解基因间的相互作用关系。
发明内容
本发明所述的方法的一大特点便是将大肠杆菌的表达谱基因芯片的数据进行统计学分析处理进行网络构建,用于研究基因之间的相互作用关系,该方法实施的基本流程为:
步骤1、待检测样品进行大肠杆菌表达谱芯片检测获得原始数据。
步骤2、对原始数据进行预处理及统计学分析并筛查差异表达的基因。
步骤3、文档搜索及格式化。
步骤4、将文档分离成单个句子,作为后续分析基本单位。
步骤5、基因描述的定位。
步骤6、统一基因描述中使用的基因符号。
步骤7、建立基因互作动词词典。
步骤8、生成需要研究基因的同义词字典,并从上述句子中提取出基因的描 述。
步骤9、统计分析基因名、基因互作动词和需要研究的基因同时出现的句子,整理成列表。
步骤10、构建相互作用关系网络。
附图说明
图1、本发明所述方法的实施流程图
实施方式
本发明将以大肠杆菌的表达谱芯片数据分析处理为例,对筛查出的差异表达基因进行基因的相互作用关系网络构建,介绍本发明所述方法的具体实施步骤。
步骤1、利用关键词从Pubmed数据库
(http://www.ncbi.nlm.nih.gov/pubmed)中搜索相关文献,下载到本地,并整理成XML格式。
步骤2、下载基于java环境的Lingpipe工具包(http://alias-i.com/lingpipe/),利用它的Sentence tokenlization工具将搜索到的摘要文本分离成单个句子,整理成文档保存,作为后续分析的基本单位。
步骤3、应用ABNER软件进行人类基因的描述的定位,并提取出基因,对于提取的基因的描述中,多个基因缩写到一起的将被分离,如“STAT3/5 gene”将被解析成STAT3 gene和STAT5 gene。
步骤4、因为搜索到的文献中对于基因名字的书写格式大多不同,为了分析的方便和准确,需要将文献中的基因符号统一为官方的基因符号,这里我们以 NCBI(www.ncbi.nlm.nih.gov/)的Entrez gene数据库为准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海聚类生物科技有限公司,未经上海聚类生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110407359.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用