[发明专利]考虑重复性的碱基序列重组系统及方法在审
申请号: | 201310373186.0 | 申请日: | 2013-08-23 |
公开(公告)号: | CN103793624A | 公开(公告)日: | 2014-05-14 |
发明(设计)人: | 朴旻胥 | 申请(专利权)人: | 三星SDS株式会社 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 金光军;韩芳 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 考虑 重复性 碱基 序列 重组 系统 方法 | ||
1.一种碱基序列重组系统,包括:
片段序列生成单元,用于由短片段生成多个片段序列;
片段序列长度调整单元,从生成的所述多个片段序列当中选择对象碱基序列上的映射重复数超过设定基准值的片段序列,并调整选择的片段序列的长度,直到所述选择的片段序列的映射重复数达到所述基准值以下;
比对单元,利用所述片段序列执行全局比对。
2.如权利要求1所述的碱基序列重组系统,其中,所述片段序列长度调整单元在所述选择的片段序列上附加构成所述短片段的一部分的一个以上的碱基。
3.如权利要求2所述的碱基序列重组系统,其中,所述片段序列长度调整单元在所述选择的片段序列的起始端或末端上增加对应于相应位置的所述短片段上的碱基。
4.如权利要求1所述的碱基序列重组系统,其中,所述片段序列长度调整单元在长度得到调整的片段序列没有被映射于所述对象碱基序列的情况下,除去所述长度得到调整的片段序列。
5.如权利要求1所述的碱基序列重组系统,还包括筛选单元,用于当生成的所述多个片段序列中存在对象碱基序列上的映射重复数超过设定上限值的片段序列时,除去对应片段序列。
6.如权利要求5所述的碱基序列重组系统,其中,所述上限值为10000。
7.一种碱基序列重组系统,包括:
片段序列生成单元,用于由短片段生成多个片段序列;
筛选单元,用于从生成的所述多个片段序列中除去对象碱基序列上的映射重复数超过设定上限值的片段序列;
比对单元,利用除了被除去的所述片段序列以外的其余片段序列而执行全局比对。
8.如权利要求7所述的碱基序列重组系统,其中,所述上限值为10000。
9.一种碱基序列重组方法,包括如下步骤:
在片段序列生成单元中,由短片段生成多个片段序列;
在片段序列长度调整单元中,从生成的所述多个片段序列当中选择对象碱基序列上的映射重复数超过设定基准值的片段序列,并调整选择的片段序列的长度,直到所述选择的片段序列的映射重复数达到所述基准值以下;
在比对单元中,利用所述片段序列执行全局比对。
10.如权利要求9所述的碱基序列重组方法,其中,在调整所述片段序列的长度的步骤中,在所述选择的片段序列上附加构成所述短片段的一部分的一个以上的碱基。
11.如权利要求10所述的碱基序列重组方法,其中,在调整所述片段序列的长度的步骤中,在所述选择的片段序列的起始端或末端上增加对应于相应位置的所述短片段上的碱基。
12.如权利要求9所述的碱基序列重组方法,其中,在调整所述片段序列的长度的步骤中,在长度得到调整的片段序列没有被映射于所述对象碱基序列的情况下,除去所述长度得到调整的片段序列。
13.如权利要求9所述的碱基序列重组方法,其中在执行生成所述片段序列的步骤之后还包括如下的筛选步骤:
如果在生成的所述多个片段序列中存在对象碱基序列上的映射重复数超过设定上限值的片段序列,则除去对应的片段序列。
14.如权利要求13所述的碱基序列重组方法,其中,所述上限值为10000。
15.一种碱基序列重组方法,包括如下步骤:
在片段序列生成单元中,由短片段生成多个片段序列;
在筛选单元中,从生成的所述多个片段序列中除去对象碱基序列上的映射重复数超过设定上限值的片段序列;
在比对单元中,利用除了被除去的所述片段序列以外的其余片段序列而执行全局比对。
16.如权利要求15所述的碱基序列重组方法,其中,所述上限值为10000。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310373186.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用