[发明专利]一种遗传图谱构建的处理方法和装置无效
申请号: | 201210454569.6 | 申请日: | 2012-11-14 |
公开(公告)号: | CN102982251A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 孔关义;王海龙;朱红梅;周广宇 | 申请(专利权)人: | 北京诺禾致源生物信息科技有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 遗传 图谱 构建 处理 方法 装置 | ||
技术领域
本发明涉及生物信息学领域,具体而言,涉及一种遗传图谱构建的处理方法和装置。
背景技术
遗传图谱的构建建立在遗传标记的基础之上,以前我们利用限制性酶切位点多态性及简单重复序列多态性等标记进行遗传作图。这些标记的数目一般都在几千到一万之间。随着基因组测序技术的进步,单细胞测序技术迅速发展并日益成熟,我们可以一次性得到数以百万计的单核苷酸多态性(Single Nucleotide Polymorphism,简称SNP),分子标记的增多使得遗传标记的密度有了很大的提高。经典的遗传图谱构建方法和软件显得束手无策,因为基于隐马氏链模型的最大似然方法计算复杂,需要很高的时间成本。这些问题目前尚未提出有效的解决方案。
针对这些问题,我们通过把遗传标记整合成标记束,然后对标记束进行连锁分析,用一种启发式的算法对标记束排序,在短时间内得到精细的遗传图谱。
发明内容
本发明的主要目的在于提供一种遗传图谱构建的处理方法和装置,以解决现有技术中无法使用更大数量级遗传标记构建更精细的遗传图谱的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种遗传图谱构建的处理方法,所述的方法包括下述步骤:
接收多个样本的SNP(单核苷酸多态性)数据;
鉴别基因组上发生重组的区域,将未发生重组的SNP位点合并成一个标记;
通过两点测验法构建基因组片段的连锁群;
计算已知顺序的标记之间的重组率及每一个连锁群内未知顺序的基因组片段之间的重组率;
根据标记之间及基因组片段之间的重组率对每一个连锁群内的基因组片段进行排序;
依次计算排好序的连锁群内相邻标记之间的重组率并转换成作图距离,得到基因组遗传图谱及排好顺序的基因组组装成的基因组片段。
前述的一种遗传图谱构建的处理方法,其中所述的鉴别基因组上发生重组的区域,将未发生重组的SNP位点合并成一个标记包括:每一个基因组片段上有许多个SNP位点,根据SNP位点在不同样本之间的组合形式判定重组发生的位置;按照发生重组的位置将一个基因组片段分割成几个区域,每个区域内的SNP可以整体当作一个标记或者说标记束。
前述的一种遗传图谱构建的处理方法,其中所述的通过两点测验法构建基因组片段的连锁群包括:遗传学上通常用或然率的常用对数作为标准的衡量方法,该值的对数值称为LOD值或对数优势比:根据两个非此即彼的假设,计算数据的整体或然性,以确定两个基因组片段或是按一定的重组率而相互连锁的可能性或是互不连锁的可能性;这两种可能性之比,是基因座实际上为连锁的可能性;这个比率的常用对数就是对数优势比;为了确定两对基因之间是否存在连锁,一般要求或然比大于1000:1,即LOD>3;而要否定连锁存在,则要求或然小于1:100,即LOD<-2;通过计算不同遗传标记之间的LOD值,来确定基因组片段是否连锁从而构建连锁群。
前述的一种遗传图谱构建的处理方法,其中所述的计算已知顺序的标记之间的重组率及每一个连锁群内未知顺序的基因组片段之间的重组率包括:每一个基因组片段上会包含一个或者多个遗传标记,计算每两个基因组片段内每对遗传标记的重组率,并按照每个标记所占据基因组片段的长度分配每对遗传标记之间的重组率占基因组片段之间重组率的比重;根据每对遗传标记之间的重组率极其比重计算基因组片段之间的重组率;依次计算每两个基因组片段之间的重组率。
前述的一种遗传图谱构建的处理方法,其中所述的根据标记之间及基因组片段之间的重组率对每一个连锁群内的基因组片段进行排序包括:根据遗传学规律,重组率越大的基因组片段距离越远,从而对每个连锁群内的基因组片段进行排序得到连锁群内基因组片段的顺序。
前述的一种遗传图谱构建的处理方法,其中所述的依次计算排好序的连锁群内相邻标记之间的重组率并转换成作图距离,得到基因组遗传图谱及排好顺序的基因组组装成的基因组片段包括:获取每个连锁群内部的基因组片段的顺序及遗传标记的顺序;利用相邻的2个标记在样本里的不同组合依次计算各连锁群内部相邻遗传标记之间的重组率;通过作图公式将相邻遗传标记之间的重组率转换成作图距离;根据作图距离依次排列遗传标记即可得到基因组的遗传图谱及排好顺序的基因组片段。
为了实现上述目的,根据本发明的另一方面,提供了一种构建遗传图谱的处理装置,该处理装置用于执行上述本发明提供的构建遗传图谱的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺禾致源生物信息科技有限公司,未经北京诺禾致源生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210454569.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:软件包信息统计及传播方法
- 下一篇:触发即时通信界面输出的方法及客户端
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用