[发明专利]一种高通量基因测序的有效数据分类寻优目标检测系统及检测方法有效
申请号: | 201310585089.8 | 申请日: | 2013-11-19 |
公开(公告)号: | CN103559425B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 梁素钰;刘滨凡;田松岩;刘延坤;李琳;孙清芳;刘广菊;刘长乐;李云红;贾丹;杜倩;邵英男;王文帆;陈瑶;李东玫;刘玉龙;王刚 | 申请(专利权)人: | 黑龙江省森林工程与环境研究所 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 哈尔滨市船大专利事务所23201 | 代理人: | 张贵丰 |
地址: | 150081 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通量 基因 有效 数据 分类 目标 检测 系统 方法 | ||
技术领域
本发明涉及的是一种基因测序数据处理装置,特别涉及一种高通量基因测序分类寻优目标检测系统。本发明也涉及一种高通量基因测序分类寻优目标检测方法。
背景技术
基因是遗传物质的基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列,由A、T、C、G四种碱基组成。基因测序方法有很多种,常见的有荧光标记的sanger法、循环阵列合成测序法、直接测序法、高通量测序法等。高通量基因测序是一次进行几十万到几百万条DNA分子的序列测定,又称为深度测序。高通量测序仪目前有罗氏公司(Roche)的454 FLX焦磷酸测序平台(454 FLX pyrosequencing platform),美国Illumina公司的Solexa基因组分析平台(Genome Analyzer platform)和ABI公司的SOLiD 测序仪(ABI SOLiD sequencer)。
高通量基因测序有效数据分类目标检测技术具有重要的地位,提供准确可用的测序序列是对基因测序工作进行分析的首要任务之一。如何从大量、繁杂的数据中,快速而又有效地找到可用序列,不仅具有重要的理论和实际意义,也是国内外基因测序数据分类目标检测的难点和热点。
公开(公告)号为CN101680872A,名称为序列比较分析方法和系统的专利文件中,公开了一种通过比较样本核酸序列信息与参考核酸序列信息或从参考样本获得的信息来快速鉴别或确定样本核酸中的序列信息的方法,还提供进行序列比较分析的自动化系统。
公开(公告)号为CN101918590A,名称为核酸测序的专利文件中,涉及核酸序列分析,高通量平行DNA序列的方法与设备。同时提供了一种筛选分析样品序列的方法,用于富集靶序列或去除特定分子,尤其是测序样品中不需要的序列模版。
公开(公告)号为 CN102477460A,名称为对宏基因组16S高可变区V6进行测序聚类分析的方法的专利文件中,公开了一种对宏基因组16S高可变区V6进行测序聚类分析的方法,该方法包括:提取微生物DNA;通过引物对宏基因组16S rDNA的高可变区V6进行PCR,并为每个样品加上标签序列;把不同样品的PCR产物进行混合;对混合后的PCR产物进行Solexa建库法建库;使用Solexa测序工具对高可变区V6的文库进行双末端pair-end测序,得到原始的测序数据;对测序数据进行筛选,以过滤掉低质量的数据;利用重叠群的关系对高可变区V6的全长序列进行组装;通过标签序列把reads分配到对应的样品上;通过对reads进行分类分析,以实现使用高可变区的测序对微生物群体进行高通量和精准的分类。发明内容
本发明的目的在于提供一种速度快、精度高的高通量基因测序的有效数据分类寻优目标检测系统。本发明的目的还在于提供一种基于本发明的高通量基因测序的有效数据分类寻优目标检测系统的检测方法。
本发明的高通量基因测序的有效数据分类寻优目标检测系统包括依次相连的测序仪、数据库模块和数据处理模块,所述测序仪对所需测序基因进行测序并将测序数据存储到所述数据库模块中;所述的数据处理模块包括数据归类模块、目标检测模块、有效数据模块、操作单元分类模块、相似度寻优模块、结果显示模块和无效数据模块,数据归类模块对所测数据序列进行归类处理,即所测数据序列若具有归类参数R所述性质,则进行读取归类,所测数据序列若不具有归类参数R所述性质,则该数据序列进入无效数据模块;目标检测模块对经过数据归类模块的循环递近归类后的数据序列进行同时满足所选归类参数有效值或有效定义的检测,通过同时满足所选归类参数有效值或有效定义的检测的数据序列,若是多于或者少于预定的实验分析数据序列数则进行数据优化;有效数据模块用以对满足循环递近归类的数据序列进行处理;操作单元分类模块用以对有效数据模块中的所有数据序列根据设定的相似度进行操作单元分类,并计算分类单元出现的频率;相似度寻优模块按照相似度的不同,设定相似度间隔百分点,将有效数据模块中的所有数据序列重新进行操作单元分类,输出操作单元分类结果及计算分类单元出现的频率;结果显示模块将目标检测模块的检测结果、有效数据的结果、操作单元分类模块的结果和计算分类单元出现的频率在结果显示模块上显示;无效数据模块存储数据归类模块和目标检测模块中的不符合要求的数据。是将权利要求书改过的部分复制到此
本发明的高通量基因测序的有效数据分类寻优目标检测系统还可以包括:
1、所述数据归类模块对测序数据进行归类处理具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江省森林工程与环境研究所,未经黑龙江省森林工程与环境研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310585089.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温钎焊用铁镍基钎料
- 下一篇:圆锯机用精切调节工装
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置