[发明专利]基于分组纠错码的测序条形码构造与软判决识别方法有效
| 申请号: | 201911137709.5 | 申请日: | 2019-11-19 |
| 公开(公告)号: | CN110929542B | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 陈为刚;王丽霞;韩昌彩 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06K7/14 | 分类号: | G06K7/14;G06K19/06 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 分组 纠错码 条形码 构造 判决 识别 方法 | ||
1.一种基于分组纠错码的测序条形码构造与软判决识别方法,其特征在于,所述方法包括:
将分组纠错码表示为不同的样本,与预定伪随机序列组合生成测序条形码;
内译码器接收测序条形码并进行解映射,建立估计碱基序列插入/删节的隐马尔科夫模型,通过对前向-后向算法进行修正,输出分组码各个比特的软判决信息;
内译码器将码字比特概率信息输入外译码器,作为先验信息进行译码,得到信息序列估计值,据此进行样本识别;
其中,所述将分组纠错码表示为不同的样本,与预定伪随机序列组合生成测序条形码具体为:
将表示某一特定样本序号的k比特的信息向量,经分组码编码器产生长度为n的分组码码字;将预定伪随机序列与分组码码字对应位置的比特组合成比特对,按照映射规则将比特对转换成碱基,生成长度为n的测序条形码,所述测序条形码用于样本建库、扩增与测序;
其中,所述建立估计碱基序列插入/删节的隐马尔科夫模型具体为:
将碱基漂移量xi作为HMM的隐状态,接收测序条形码估计值作为HMM的观测向量;当发送第i个碱基ti时,发生从xi-1到xi的状态转移,接收测序条形码子序列r(i)输出;
进一步地,所述通过对前向-后向算法进行修正,输出分组码各个比特的软判决信息具体为:
计算由当前时刻的漂移状态a转移到下一时刻的漂移状态b的转移概率Pa,b;
对由xi=a转移到xi+1=b时,计算输出碱基序列的条件概率;
对0≤i<n,-xmax≤a≤xmax,a-1≤b≤a+I且b∈X,计算发送碱基为ti=λ时,从状态xi=a转移到xi+1=b得到接收碱基序列的中间度量值;
对0≤i<n,-xmax≤a≤xmax,初始化第0时刻的前向度量值,利用转移概率Pc,a和输出概率,计算第i时刻状态xi=a的前向度量值;
对0<i≤n,-xmax≤b≤xmax,初始化第n时刻的后向度量值,利用转移概率Pb,c和输出概率,递归计算第i时刻状态xi=b的后向度量值;
对0≤i<n,计算发送碱基ti=λ时的核苷酸级软信息;
对0≤i<n,基于核苷酸级软信息,根据发送碱基与码字比特的映射关系,计算码字比特di取0和1的概率值,组成比特级软信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911137709.5/1.html,转载请声明来源钻瓜专利网。





