[发明专利]DNA测序仪短序列回贴基因组方法无效

专利信息
申请号: 201010519782.1 申请日: 2010-10-19
公开(公告)号: CN102453751A 公开(公告)日: 2012-05-16
发明(设计)人: 马斌 申请(专利权)人: 鼎生科技(北京)有限公司
主分类号: C12Q1/68 分类号: C12Q1/68;G06F19/10
代理公司: 北京海虹嘉诚知识产权代理有限公司 11129 代理人: 闫强
地址: 100085 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: dna 测序仪短 序列 基因组 方法
【权利要求书】:

1.DNA测序仪短序列回贴基因组方法,其特征在于包括如下步骤:

用全长离散种子组合对DNA测序仪产生的短序列和基因组做索引,以筛选出可能回贴的位置集合;

全长离散种子为长度与所述短序列长度相同的代码串,代码串由若干位匹配码和通配符组成;匹配码代表需要将所述短序列和基因组进行比对的位,通配符代表不需要将所述短序列和基因组进行比对的位;所述全长离散种子组合为所述短序列回帖基因组达到100%查全率需要最低数量全长离散种子的组合;

对应多种情况的所述全长离散种子组合如下所示,其中一个s#.w#.r#或者s#.w#.z#表示一组全长离散种子,#代表数字,s后面的数字表示种子长度,w后面的数字表示种子的权重,r后面的数字表示能达到100%查全率所允许的错配个数,z后面的数字表示能达到100%查全率所允许的在颜色空间允许的错配个数;r和z分别对应两种DNA测序仪输出短序列;1代表所述匹配码,*代表通配符;所述全长离散种子组合还包括如下所示任意全长离散种子组合的列置换后的结果:

s15.w11.r1

*11111111111***

****11111111111

1111****1111111

11111111****111

s17.w11.r1

*11111111111*****

******11111111111

111111******11111

s18.w13.r1

1111111111111*****

*****1111111111111

111111111****1111*

11111****11111111*

s20.w13.r1

1111111111111*******

*******1111111111111

*111111******1111111

s26.w13.r1

1111111111111*************

*************1111111111111

s14.w8.r2

11**111111****

**11**111111**

****11**111111

111111****11**

**111111****11

1111****11**11

11****11**1111

s16.w8.r2

11111111********

****11111111****

********11111111

1111****1111****

****1111****1111

1111********1111

s17.w9.r2

111**111111******

***111**111111***

******111**111111

11111******1**111

11111*11****11***

111******1**11111

***111*1*11***111

s18.w9.r2

111111***111******

***111111***111***

******111111***111

111******111111***

***111******111111

111***111******111

s19.w9.r2

111111111**********

****111111111******

**********111111111

1111*****11111*****

*****1111*****11111

1111**********11111

s20.w10.r2

11111*****11111*****

*****1111111111*****

11111**********11111

*****11111*****11111

1111111111**********

**********1111111111

s22.w10-12.r2

11111111111***********

*****11111111111******

***********11111111111

11111******11111******

*****111111*****111111

11111***********111111

s23.w11.r2

11111111111************

*****11111111111*******

************11111111111

11111******111111******

******11111******111111

11111************111111

s24.w12.r2

111111111111************

************111111111111

111111******111111******

111111************111111

******111111111111******

******111111******111111

s26.w12-13.r2

1111111111111*************

******1111111111111*******

*************1111111111111

111111*******111111*******

******1111111******111111*

111111*************1111111

s27.w13.r2

1111111111111**************

******1111111111111********

**************1111111111111

111111*******1111111*******

*******111111*******1111111

111111**************1111111

s28.w13.r2

111*1**111*1**111*1**1******

*111*1**111*1**111*1**1*****

**111*1**111*1**111*1**1****

***111*1**111*1**111*1**1***

****111*1**111*1**111*1**1**

*****111*1**111*1**111*1**1*

******111*1**111*1**111*1**1

s30.w13.r2

1111111111111*****************

*************1111111111111****

*****************1111111111111

********111111111*********1111

11111********1111*********1111

s32.w13.r2

1111111111111*******************

111111*******1111111************

111111**************1111111*****

******1111111111111*************

*******************1111111111111

s33.w13.r2

*******1111111111111*************

********************1111111111111

1111111111111********************

1111111******111111**************

s39.w13.r2

1111111111111**************************

*************1111111111111*************

**************************1111111111111

s25.w10.r3

1111111111***************

*****1111111111**********

**********1111111111*****

***************1111111111

11111*****11111**********

*****11111*****11111*****

**********11111*****11111

11111**********11111*****

*****11111**********11111

11111***************11111

s30.w12.r3

111111111111******************

******111111111111************

************111111111111******

******************111111111111

111111******111111************

******111111******111111******

************111111******111111

111111************111111******

******111111************111111

111111******************111111

s34.w13.r3

1111111111111*********************

*******1111111111111**************

**************1111111111111*******

*********************1111111111111

1111111*******111111**************

*******1111111*******111111*******

**************1111111*******111111

1111111**************111111*******

*******1111111**************111111

1111111*********************111111

s36.w13.r3

111*1**1***111*1**1***111***********

*111*1**1***111*1**1***111**********

**111*1**1***111*1**1***111*********

***111*1**1***111*1**1***111********

****111*1**1***111*1**1***111*******

*****111*1**1***111*1**1***111******

******111*1**1***111*1**1***111*****

*******111*1**1***111*1**1***111****

********111*1**1***111*1**1***111***

*********111*1**1***111*1**1***111**

**********111*1**1***111*1**1***111*

s42.w12.r3

111111111111******************************

******111111111111************************

************111111111111******************

******************111111111111************

************************111111111111******

******************************111111111111

111111******************************111111

s46.w13.r3

1111111111111*********************************

*******1111111111111**************************

********************1111111111111*************

*********************************1111111111111

1111111******111111***************************

s52.w13.r3

1111111111111***************************************

*************1111111111111**************************

**************************1111111111111*************

***************************************1111111111111

s30.w10.r4

1111111111********************

*****1111111111***************

**********1111111111**********

***************1111111111*****

********************1111111111

11111*****11111***************

*****11111*****11111**********

**********11111*****11111*****

***************11111*****11111

11111**********11111**********

*****11111**********11111*****

**********11111**********11111

11111***************11111*****

*****11111***************11111

11111********************11111

s36.w12.r4

111111111111************************

******111111111111******************

************111111111111************

******************111111111111******

************************111111111111

111111******111111******************

******111111******111111************

************111111******111111******

******************111111******111111

111111************111111************

******111111************111111******

************111111************111111

111111******************111111******

******111111******************111111

111111************************111111

s41.w13.r4

1111111*111111***************************

*******1111111*111111********************

**************1111111*111111*************

*********************1111111*111111******

1111111********111111********************

*******1111111********111111*************

**************1111111********111111******

1111111***************111111*************

*******1111111***************111111******

**************1111111**************111111

1111111**********************111111******

1111111****************************111111

*******1111111*********************111111

*********************1111111*******111111

****************************1111111111111

s42.w12.r4

111111111111******************************

************111111111111******************

************************111111111111******

******************************111111111111

************************111111******111111

111111******111111************************

111111************111111******************

******111111111111************************

******111111******111111******************

s45.w12-13.r4

1111111111111********************************

*************1111111111111*******************

**************************1111111111111******

********************************1111111111111

**************************111111*******111111

111111*******111111**************************

111111*************1111111*******************

******1111111111111**************************

******1111111******111111********************

s46.w12-13.r4

1111111111111*********************************

*************1111111111111********************

**************************1111111111111*******

*********************************1111111111111

**************************1111111******111111*

1111111******111111***************************

1111111*************111111********************

*******1111111111111**************************

*******111111*******111111********************

s49.w13.r4

1111111111111************************************

**************1111111111111**********************

****************************1111111111111********

***********************************1111111111111*

****************************1111111*******111111*

1111111*******111111*****************************

1111111**************111111**********************

*******1111111111111*****************************

*******1111111*******111111**********************

s65.w13.r4

1111111111111****************************************************

*************1111111111111***************************************

**************************1111111111111**************************

***************************************1111111111111*************

****************************************************1111111111111

s78.w13.r5

1111111111111*****************************************************************

*************1111111111111****************************************************

**************************1111111111111***************************************

***************************************1111111111111**************************

****************************************************1111111111111*************

*****************************************************************1111111111111

s91.w13.r6

1111111111111******************************************************************************

*************1111111111111*****************************************************************

**************************1111111111111****************************************************

***************************************1111111111111***************************************

****************************************************1111111111111**************************

*****************************************************************1111111111111*************

******************************************************************************1111111111111

s23.w11.z2

11111111111************

************11111111111

s24.w12.z4

1111*1111*1111**********

1111*1111******1111*****

1111*1111***********1111

1111******1111*1111*****

1111******1111******1111

1111***********1111*1111

*****1111*1111*1111*****

*****1111*1111******1111

*****1111******1111*1111

**********1111*1111*1111

s25.w12-13.z4

11111*1111*1111**********

11111*1111******1111*****

11111*1111***********1111

11111******1111*1111*****

11111******1111******1111

11111***********1111*1111

******1111*1111*1111*****

******1111*1111******1111

******1111******1111*1111

***********1111*1111*1111

s34.w13.z4

11111*11111111********************

***************1111*111111111*****

********************111111111*1111

*********11111*1111***********1111

11111**********1111***********1111

s38.w12.z4

111111111111**************************

*************111111111111*************

**************************111111111111

s41.w13.z4

1111111111111****************************

**************1111111111111**************

****************************1111111111111

s29.w12.z6

1111*1111*1111***************

1111*1111******1111**********

1111*1111***********1111*****

1111*1111****************1111

1111******1111*1111**********

1111******1111******1111*****

1111******1111***********1111

1111***********1111*1111*****

1111***********1111******1111

1111****************1111*1111

*****1111*1111*1111**********

*****1111*1111******1111*****

*****1111*1111***********1111

*****1111******1111*1111*****

*****1111******1111******1111

*****1111***********1111*1111

**********1111*1111*1111*****

**********1111*1111******1111

**********1111******1111*1111

***************1111*1111*1111

s34.w12.z6

111111*111111*********************

111111********111111**************

111111***************111111*******

111111**********************111111

*******111111*111111**************

*******111111********111111*******

*******111111***************111111

**************111111*111111*******

**************111111********111111

*********************111111*111111

s35.w12-13.z6

1111111*111111*********************

1111111********111111**************

1111111***************111111*******

1111111**********************111111

********111111*111111**************

********111111********111111*******

********111111***************111111

***************111111*111111*******

***************111111********111111

**********************111111*111111

s39.w13.z6

1111111*111111*************************

1111111*********111111*****************

1111111*****************111111*********

1111111*************************111111*

********1111111*111111*****************

********1111111*********111111*********

********1111111*****************111111*

****************1111111*111111*********

****************1111111*********111111*

************************1111111*111111*

s47.w11.z6

11111111111************************************

************11111111111************************

************************11111111111************

************************************11111111111

s48.w12.z6

111111************************************111111

111111*111111***********************************

*******111111*111111****************************

**************111111*111111*********************

*********************111111*111111**************

****************************111111*111111*******

***********************************111111*111111

s41.w12.z8

111111*111111****************************

111111********111111*********************

111111***************111111**************

111111**********************111111*******

111111*****************************111111

*******111111*111111*********************

*******111111********111111**************

*******111111***************111111*******

*******111111**********************111111

**************111111*111111**************

**************111111********111111*******

**************111111***************111111

*********************111111*111111*******

*********************111111********111111

****************************111111*111111

s48.w12.z8

111111*111111***********************************

**************111111*111111*********************

****************************111111*111111*******

***********************************111111*111111

****************************111111********111111

111111********111111****************************

111111***************111111*********************

*******111111*111111****************************

*******111111********111111*********************。

2.根据权利要求1所述DNA测序仪短序列回贴基因组方法,其特征在于s#.w#.z#代表的DNA测序仪输出的短序列回帖基因组过程利用Intel芯片中的SSE指令集进行加速,伪码如下:

输入:短序列R=R0...L-1(L为序列长度,Ri1{0,1,2,3}),其Adaptor为Ada(R)1{A,C,G,T};

          参考序列G(Gi1{A,C,G,T});

输出:R与G最佳比对下的错配个数

int min_mismatch(R,G)

/*

    令F(A)=0,F(C)=1,F(G)=2,F(T)=3,将字母映射为数字;

         令X为128位整数,由四个32位整数X0X1X2X3组成,Xi进而由四个8位整

    数Xi0Xi1Xi2Xi3组成;

         令T为和X长度一致的128位整数;

         令Y[0...3]和Z[0...3]为和X长度一致的128位整数数组,定义如下:

         Y[0]=0001 0001 0001 0000;(共128位)

         Y[1]=0001 0001 0000 0001;

         Y[2]=0001 0000 0001 0001;

         Y[3]=0000 0001 0001 0001;

         Z[0]=0111 1011 1101 1110;

         Z[1]=1011 0111 1110 1101;

         Z[2]=1101 1110 0111 1011;

         Z[3]=1110 1101 1011 0111;

    */

    X=Y[F(Ada(R))];

    for i from 0 to L-1

      T00=X00;T01=X10;T02=X20;T03=X30;//PACKSSDW,PACKSSWB

      T1=T0;T2=T0;T3=T0;//PUNPCKLDQ

      X+=Z[Ri];//PADDB

      Xi0=min{Xi0,Xi1,Xi2,Xi3};//PMINUB

      X+=Y[Gi];//PADDB

    done

      return min{X00,X10,X20,X30};//PMINUB

end。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎生科技(北京)有限公司,未经鼎生科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010519782.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top