[发明专利]分型方法和装置有效
| 申请号: | 201680067128.7 | 申请日: | 2016-02-18 |
| 公开(公告)号: | CN108350498B | 公开(公告)日: | 2021-10-19 |
| 发明(设计)人: | 章元伟;张涛;曹红志 | 申请(专利权)人: | 深圳华大生命科学研究院 |
| 主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 赵天月 |
| 地址: | 518083 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 方法 装置 | ||
1.一种分型方法,所述方法用于非疾病诊断目的,其特征在于,包括:
获取待测样品的测序数据,所述测序数据包括多个来自目标区域的读段;
将参考序列组比对至基准序列组,获得型别集合,所述型别集合包含多个型别,
所述基准序列组包含一条或多条基准序列,所述基准序列组能够完全覆盖所述目标区域的所有基因序列,不同所述基准序列包含不同的基因全序列,
所述参考序列组包括多条参考序列,所述参考序列组能够完全覆盖所述目标区域的编码区序列的所有外显子,不同所述参考序列包含不同的外显子;
将所述测序数据比对至所述参考序列组,获得比对结果;
将所述比对结果转化为相对于所述基准序列组的比对结果,获得转化的比对结果;
基于所述转化的比对结果,分别对比对上相同基准序列的读段进行组装,获得组装结果,所述组装结果包括多个单体型;
比较所述单体型上的变异和所述型别集合中的型别,以确定所述单体型支持的型别;
依据支持所述型别的单体型和支持所述型别的读段,将所述型别分成两组,获得第一候选型别组和第二候选型别组;
基于支持所述型别的单体型和支持所述型别的读段,分别对所述第一候选型别组和所述第二候选型别组中的型别进行筛选,以确定主要型别和次要型别;
基于支持所述主要型别和支持所述次要型别的读段的数目的差异,判定所述目标区域的基因型。
2.权利要求1的方法,其特征在于,所述目标区域包括HLA-DRB3、HLA-DRB4和HLA-DRB5中的至少之一。
3.权利要求1的方法,其特征在于,所述目标区域包括HLA-DRB3、HLA-DRB4和HLA-DRB5。
4.权利要求1的方法,其特征在于,所述参考序列组通过以下步骤构建获得:
获得包含所述目标区域的编码区序列和基因全序列;
将所述编码区序列按外显子分割,获得多个外显子序列;
从与所述外显子序列最接近型别的基因全序列提取该外显子序列两侧各K bp的序列,加到对应的外显子序列的两侧,获得所述参考序列组中的参考序列,其中K依据读段的长度来确定。
5.权利要求1的方法,其特征在于,一条所述基准序列为所述目标区域中的一个基因的基因全序列。
6.权利要求1的方法,其特征在于,所述基于转化的比对结果,分别对比对上相同基准序列的读段进行组装,获得组装结果,所述组装结果包括多个单体型,包括:
对比对上相同基准序列的读段,利用具有重叠部分并且所述重叠部分完全一致的读段进行所述组装,以获得所述多个单体型。
7.权利要求1的方法,其特征在于,在获得所述组装结果之后,过滤掉对所述外显子的覆盖度低于95%的单体型。
8.权利要求1的方法,其特征在于,在确定单体型支持的型别之前进行以下:
分别基于比对上相同基准序列的读段的组装结果,对每个所述单体型进行打分,基于获得的单体型的分值对所述单体型进行筛选,获得候选单体型;
以所述候选单体型替代所述单体型。
9.权利要求8的方法,其特征在于,利用以下公式对每个所述单体型进行打分,以确定所述单体型的分值Score:
其中,
c为所述单体型对所述外显子的覆盖度,
N为支持所述单体型的读段数目,
R表示所述单体型的可靠性,
Xi为所述单体型的位置i的测序深度,i为所述单体型上的位置的编号,
X为所述单体型的平均深度,
L为所述单体型的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680067128.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:单细胞核酸序列分析
- 下一篇:可转化标记组合物、方法及结合其的过程





