[发明专利]基因表达的定量方法及装置有效
申请号: | 201410108121.8 | 申请日: | 2014-03-21 |
公开(公告)号: | CN103902852B | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 黄文潘;卢志远;龚梅花;章文蔚;席凤;韩鸿雁 | 申请(专利权)人: | 深圳华大基因科技有限公司 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 深圳鼎合诚知识产权代理有限公司44281 | 代理人: | 彭愿洁,彭家恩 |
地址: | 518083 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 表达 定量 方法 装置 | ||
技术领域
本发明涉及基因组学及生物信息学技术领域,具体涉及一种基因表达的定量方法及装置。
背景技术
转录组测序技术(RNA-seq,RNA sequencing)是把小RNA(Ribonucleic Acid,核糖核酸)、mRNA和非编码RNA等或者其中一些用高通量测序技术把它们的序列测出来。目前RNA-seq测序平台有多种,包括Hiseq、Roche FLX、Illumina Solexa、ABI solid等。不同测序平台的测序原理有所不同,但测序步骤基本包括文库制备,聚合酶链式反应(PCR,Polymerase Chain Reaction)扩增等。通过RNA-seq,科研工作者能够获得生物中基因表达的情况,研究不同个体、不同时期、不同形态的组织的基因表达水平的差异。
中国专利申请(申请号:201110283718.2,名称:一种分析基因表达定量的方法)基于Illumina平台公开一种分析基因表达定量的方法,可以克服数字基因表达谱(DGE,Digital Gene Expression)技术对CATG位点和参考基因完整性依赖性强的缺点。但是,该方法测序分析需时较长,劳动效率有待提高。
发明内容
本发明提供一种基因表达的定量方法及装置,可以快速地完成基因表达的定量。
依据本发明的一方面提供一种基因表达的定量方法,包括:获取含有核酸序列信息的读段序列;将读段序列与所有参考基因进行比对,获取比对上的读段序列;对比对上的读段序列进行过滤,舍去软剪切比例超过第一预设值,序列长度小于第二预设值,以及比对得分小于第三预设值的读段序列,软剪切比例是指没有比对上的碱基数目占该读段序列总碱基数目的比例;比对得分是按照每个读段序列与参考基因的匹配程度以及读段序列的长度而确定的数值;对于已过滤的读段序列,使用每百万读段序列中来自目标基因每千碱基长度的读段序列数目RPKM对所述目标基因表达进行定量,定义为RPKM=(比对到目标基因对应的参考基因的读段序列的数目)*109/(比对到所有参考基因的读段序列的数目*目标基因的长度)。
优选地,比对到目标基因对应的参考基因的读段序列的数目是指只能比对到目标基因对应的参考基因上,而且能够比对到所述参考基因的至少一个转录本的读段序列的数目;目标基因的长度是指目标基因的所有转录本中最长的转录本的长度。
依据本发明的另一方面提供一种基因表达的定量装置,包括:数据输入单元,用于输入数据;数据输出单元,用于输出数据;存储单元,用于存储数据,其中包括可执行的程序;处理器,与数据输入单元、数据输出单元及存储单元数据连接,用于执行存储单元中存储的可执行的程序,该程序的执行包括完成上述基因表达的定量方法。
本发明的有益效果是:通过将读段序列与参考基因进行比对,而不是现有的与参考基因组进行比对,可以简化比对过程,提高比对效率。特别地,比对到目标基因对应的参考基因的读段序列的数目是指只能比对到目标基因对应的参考基因上,而且能够比对到所述参考基因的至少一个转录本的读段序列的数目,则不会认为这部分读段序列是重复比对而需要被过滤,从而提高RPKM和QPCR的相关性,即提高基因表达定量的准确性。
附图说明
图1为现有技术中RNA-seq的流程图;
图2为本发明实施例一的流程图(A);
图3为本发明实施例一的流程图(B);
图4为本发明实施例一的读段序列选择示意图;
图5是本发明实施例一的HBRR标准品和QPCR标准的相关性结果图;
图6是本发明实施例一的HBRR标准品的重复性结果图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
现有的高通量测序平台有多种,包括Roche454,Ion PGM和Ion Proton等。本发明中的实施例以Ion Proton测序平台作说明,其他测序平台亦同样适用本发明所提供的方法,测序平台并不构成本发明的限制。RNA样本的文库构建一般包括将RNA反转录为DNA来进行文库构建,RNA的提取、构建文库等均可利用现有技术进行,测序文库构建步骤一般包括打断、末端修复、加proton接头、扩增等,请参考图1,测序步骤及参数可以根据不同测序平台的建议操作说明、测试样本种类进行调整,不构成对本发明的限制。实施例中未注明具体条件的,按照常规条件或制造商建议的条件进行;所用试剂或仪器未注明生产厂商的,均为可以通过市面购买获得的常规产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技有限公司,未经深圳华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410108121.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种彩色涂层压花铝板
- 下一篇:端部无粘结钢筋混凝土柱及制备方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用