[发明专利]碱基序列对准系统及方法在审
申请号: | 201410276504.6 | 申请日: | 2014-06-19 |
公开(公告)号: | CN104239749A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 朴旻壻 | 申请(专利权)人: | 三星SDS株式会社 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 孙昌浩;韩芳 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 碱基 序列 对准 系统 方法 | ||
1.一种碱基序列对准系统,包括:
种子生成单元,由所接收的短片段生成多个种子;
筛选单元,将生成的所述种子映射于参考序列,并通过考虑映射的种子之间的间隔而选择所述映射的种子中的全局对准对象种子;
对准单元,在被选择的所述种子的所述参考序列上的映射位置上执行所述短片段的针对所述参考序列的全局对准。
2.如权利要求1所述的碱基序列对准系统,其中,所述筛选单元将映射于所述参考序列的种子当中的、种子之间的间隔之和在设定值以下的种子选择为所述全局对准对象种子。
3.如权利要求2所述的碱基序列对准系统,其中,所述筛选单元将映射于所述参考序列的种子当中的、满足如下数学式的种子选择为所述全局对准对象种子:
A≤MaxError+B,
其中,A为被选择的各个种子在所述参考序列内的间隔之和,B为被选择的各个种子在所述短片段内的间隔之和,MaxError为最大误差允许值。
4.如权利要求1所述的碱基序列对准系统,其中,所述系统还包括:
精确匹配单元,执行所接收的短片段的针对所述参考序列的精确匹配;
误差个数估计单元,针对在所述精确匹配单元中没有得到精确匹配的短片段,估计出将相关短片段对准于所述参考序列时的误差个数,
其中,所述种子生成单元在估计出的所述误差个数在设定的最大误差允许值以下时由所述短片段生成多个种子。
5.一种碱基序列对准方法,包括如下步骤:
在种子生成单元中,由所接收的短片段生成多个种子;
在筛选单元中,将生成的所述种子映射于参考序列,并通过考虑映射的种子之间的间隔而选择所述映射的种子中的全局对准对象种子;
在对准单元中,在被选择的所述种子的所述参考序列上的映射位置上执行所述短片段的针对所述参考序列的全局对准。
6.如权利要求5所述的碱基序列对准方法,其中,在选择所述全局对准对象种子的步骤中,将映射于所述参考序列的种子当中的、种子之间的间隔之和在设定值以下的种子选择为所述全局对准对象种子。
7.如权利要求6所述的碱基序列对准方法,其中,在选择所述全局对准对象种子的步骤中,将映射于所述参考序列的种子当中的、满足如下数学式的种子选择为所述全局对准对象种子:
A≤MaxError+B,
其中,A为被选择的各个种子在所述参考序列内的间隔之和,B为被选择的各个种子在所述短片段内的间隔之和,MaxError为最大误差允许值。
8.如权利要求5所述的碱基序列对准方法,其中,在执行生成所述种子的步骤之前,还包括如下步骤:
在精确匹配单元中,执行所接收的短片段的针对所述参考序列的精确匹配;
在误差个数估计单元中,针对在执行所述精确匹配的步骤中没有得到精确匹配的短片段,估计出将相关短片段对准于所述参考序列时的误差个数,
其中,在生成所述种子的步骤中,当估计出的所述误差个数在设定的最大误差允许值以下时由所述短片段生成多个种子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410276504.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种竹片烘干双层隧道窑
- 下一篇:高纯矿物颗粒干燥装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用