[发明专利]一种基于二代测序数据的HLA分型方法有效
申请号: | 202110559161.4 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113409890B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 丛华剑;张倩;郭现超;洪轲;陈守林;王燕 | 申请(专利权)人: | 银丰基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 赵玉凤 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二代 序数 hla 方法 | ||
1.一种基于二代测序数据的HLA分型方法,其特征在于:包括以下步骤:
S01)、构建HLA参考基因序列数据库,具体为:
S11)、下载HLA型别数据库,将所有HLA型别对应的序列进行处理,标准化为长度一致的序列;
S12)、生成每一个型别序列的坐标映射向量,坐标映射向量是一条序列的每个碱基在数据库中的标准坐标位置的映射数值向量;
S13)、构建HLA参考基因序列数据库,在数据库中添加型别序列,每次增加一条型别序列,并确保该型别序列与数据库中的其他序列的差异值均大于预设阈值T1;
S02)、进行HLA二代测序数据的分析,具体为:
S21)、对原始HLA二代测序数据进行质控与过滤,去除低质量数据,所述低质量数据是指测序质量不合格和长度小于最低长度的reads;
S22)、进行序列比对,将经过步骤S21的原始HLA二代测序数据比对至构建好的HLA参考基因序列数据库,得到初次比对结果;
S23)、进行二次比对,将初次比对后的结果进行统计,计算出数据库中每个型别序列的最佳匹配次数,按照从高到低排序,将匹配次数排在前N的型别序列重新组建成新的HLA参考基因序列数据库,缩小比对范围,重新进行二次比对;
S24)、统计参考基因序列每一个坐标上的比对结果信息;
S03)、通过聚类算法判断杂合碱基位置,对基因上同一个外显子或内含子区域的比对结果进行聚类算法分类,分离出杂合碱基位置与纯合碱基位置,纯合碱基位置是指某一坐标位置处的序列比对结果为单一碱基,杂合碱基位置是指某一坐标位置处的序列比对结果为两个碱基同时出现;
S04)、获取单倍体序列,提取所有至少覆盖两个杂合碱基位置的原始reads序列,进行局部序列重比对,获取单倍体序列结果;
S05)、进行序列分型,将获取的单倍体序列比对至HLA型别数据库中,获取正确的分型结果。
2.根据权利要求1所述的基于二代测序数据的HLA分型方法,其特征在于:通过聚类算法判断杂合碱基位置的过程为:
S31)、计算出每个位置的碱基频率,由高到低进行排序,将反映杂合情况的第二高的频率值作为聚类算法的选取对象,随机选取2个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心;
S32)、聚类中心以及分配给它们的对象就代表一个聚类,每分配一个样本,聚类的聚类中心根据聚类中现有的对象被重新计算;
S33)、重复步骤S32,直到没有对象被重新分配给不同的聚类;
S34)、最终确定的两个聚类中心的频率值如果相差小于阈值T2,则判断整个区域均为纯合碱基,如果两个聚类中心的频率值相差大于或者等于阈值T2,则该测序区域包含杂合碱基,分配给频率值高的聚类中心的位置判定为杂合碱基位置,分配给频率值低的聚类中心的位置判定为纯合碱基位置。
3.根据权利要求1所述的基于二代测序数据的HLA分型方法,其特征在于:步骤S22中,采用bowtie2算法进行序列比对, Bowtie2使用FM索引对基因组进行索引,将测序reads与HLA参考基因序列数据库中的长参考序列进行比对,经过序列比对之后的文件包括比对到参考基因组上的位置以及比对的插入缺失信息。
4.根据权利要求1所述的基于二代测序数据的HLA分型方法,其特征在于:获取单倍体序列的过程为:对参考序列位置上距离较近的两个杂合位置进行reads重新比对,距离较近的两个杂合位置指两个杂合位置在一对测序reads的范围之内,统计在同一条read上的突变组合个数,个数多于其他组合一倍以上的组合判定两个突变位于同一条染色体上,进而最终确定单倍型序列。
5.根据权利要求1所述的基于二代测序数据的HLA分型方法,其特征在于:步骤S11中,登录IMGT官网,下载最新HLA型别数据库。
6.根据权利要求1所述的基于二代测序数据的HLA分型方法,其特征在于:步骤S11中,对不同型别序列中的插入和缺失数据在正确位置用符号表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银丰基因科技有限公司,未经银丰基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110559161.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自加热瓶盖
- 下一篇:一种药剂科用柔性中药材磨粉设备