[发明专利]一种遗传图谱构建的处理方法和装置无效
| 申请号: | 201210454569.6 | 申请日: | 2012-11-14 |
| 公开(公告)号: | CN102982251A | 公开(公告)日: | 2013-03-20 |
| 发明(设计)人: | 孔关义;王海龙;朱红梅;周广宇 | 申请(专利权)人: | 北京诺禾致源生物信息科技有限公司 |
| 主分类号: | G06F19/18 | 分类号: | G06F19/18 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100083 北京市昌平区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 遗传 图谱 构建 处理 方法 装置 | ||
1.一种基于高通量测序数据构建遗传图谱的处理方法,其特征在于,包括:
接收多个样本的SNP(单核苷酸多态性)数据;
鉴别基因组上发生重组的区域,将未发生重组的SNP位点合并成一个标记;
通过两点测验法构建基因组片段的连锁群;
计算已知顺序的标记之间的重组率及每一个连锁群内未知顺序的基因组片段之间的重组率;
根据标记之间及基因组片段之间的重组率对每一个连锁群内的基因组片段进行排序;
依次计算排好序的连锁群内相邻标记之间的重组率并转换成作图距离,得到基因组遗传图谱及由排好顺序的基因组组装成的基因组片段。
2.根据权利要求1所述的处理方法,其特征在于,鉴别基因组上发生重组的区域,将未发生重组的SNP位点合并成一个标记包括:
每一个基因组片段上有许多个SNP位点,根据SNP位点在不同样本之间的组合形式判定重组发生的位置;按照发生重组的位置将一个基因组片段分割成几个区域,每个区域内的SNP整体当作一个标记或者说标记束。
3.根据权利要求1所述的处理方法,其特征在于,通过两点测验法构建基因组片段的连锁群包括:
根据两个非此即彼的假设,计算数据的整体或然性,以确定两个基因组片段或是按一定的重组率而相互连锁的可能性或是互不连锁的可能性;这两种可能性之比,是基因座实际上为连锁的可能性;这个比率的常用对数就是对数优势比;为了确定两对基因之间是否存在连锁,一般要求或然比大于1000:1,即LOD>3;而要否定连锁存在,则要求或然比小于1:100,即LOD<-2;通过计算不同遗传标记之间的LOD值,来确定基因组片段是否连锁从而构建连锁群。
4.根据权利要求1所述的处理方法,其特征在于,计算已知顺序的标记之间的重组率及每一个连锁群内未知顺序的基因组片段之间的重组率包括:
每一个基因组片段上会包含一个或者多个遗传标记,计算每两个基因组片段内每对遗传标记的重组率,并按照每个标记所占据基因组片段的长度分配每对遗传标记之间的重组率占基因组片段之间重组率的比重;根据每对遗传标记之间的重组率及其比重计算基因组片段之间的重组率;依次计算每两个基因组片段之间的重组率。
5.根据权利要求1所述的处理方法,其特征在于,根据标记之间及基因组片段之间的重组率对每一个连锁群内的基因组片段进行排序包括:
根据遗传学规律,重组率越大的基因组片段距离越远,从而对每个连锁群内的基因组片段进行排序得到连锁群内基因组片段的顺序。
6.根据权利要求1所述的处理方法,其特征在于,依次计算排好序的连锁群内相邻标记之间的重组率并转换成作图距离,得到基因组遗传图谱及排好顺序的基因组组装成的基因组片段包括:
获取每个连锁群内部的基因组片段的顺序及遗传标记的顺序;利用相邻的2个标记在样本里的不同组合依次计算各连锁群内部相邻遗传标记之间的重组率;通过作图公式将相邻遗传标记之间的重组率转换成作图距离;根据作图距离依次排列遗传标记即可得到基因组的遗传图谱及排好顺序的基因组片段。
7.一种构建遗传图谱的处理装置,其特征在于,包括:
接收单元,用于接收多个样本SNP数据;
判定单元,与接收单元相连接,用于判定重组位点,将SNP整合成标记束;
构建单元,与判定单元相连接,用于构建连锁群;
计算单元,与构建单元相连接,计算每一个连锁群内遗传标记及基因组片段间的重组率;
排序单元,与计算单元相连接,用于连锁群内基因组片段的顺序排列;
转换单元,与排序单元相连接,与计算单元结合使用,用于将重组率转换成作图距离;
输出单元,与转换单元相连接,用于输出遗传图谱信息及按顺序排列的基因组片段。
8.根据权利要求7所述的处理装置,其特征在于,计算单元包括:
获取子单元,用于获取SNP标记束在各个样本中的形态信息,包括标记间发生重组个体数与未发生重组个体数;
重组率计算子单元,用于计算两个标记之间的重组率;
比重分配单元,用于对基因组片段间的SNP标记对的重组率占基因组片段重组率的比重;
整合子单元,用于整合两个基因组片段间SNP标记对的重组率及分配比重得到基因组片段间的重组率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺禾致源生物信息科技有限公司,未经北京诺禾致源生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210454569.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:软件包信息统计及传播方法
- 下一篇:触发即时通信界面输出的方法及客户端
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





