[发明专利]一种用于基因检测的血小板核酸文库构建方法和试剂盒在审
申请号: | 201810782077.7 | 申请日: | 2018-07-17 |
公开(公告)号: | CN108949909A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 肖剑萍;叶国栋;许剑雄;陈茂立;韩大雄;郭奇伟;蔡逸民;杨燕燕;李顺杰;董康梅;朱莎莎;张丽芳;宋丹 | 申请(专利权)人: | 厦门生命互联科技有限公司 |
主分类号: | C12Q1/6806 | 分类号: | C12Q1/6806;C12Q1/6869;C12N15/11;C12N15/10;C40B50/06;G06F19/18;G06F19/28 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 秦华 |
地址: | 361000 福建省厦门市海沧区翁*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 血小板 核酸捕获探针 核酸文库 试剂盒 构建 标签序列 基因检测 扩增引物序列 分离血小板 生物素修饰 接头序列 临床意义 文库构建 胸腺嘧啶 样本混合 单分子 起始量 测序 扩增 全血 通量 样本 检测 应用 | ||
1.一种核酸捕获探针,其特征在于,所述核酸捕获探针从5'开始,依次为,5'端生物素修饰、扩增引物序列P1、测序接头序列P5、样本标签序列、单分子标签序列和多聚胸腺嘧啶Oligo(dT)序列。
2.如权利要求1所述核酸捕获探针,其特征在于,所述扩增引物序列P1如SEQ ID NO:1所示,测序接头序列P5如SEQ ID NO:2所示,样本标签序列由3~4个核苷酸组成,单分子标签序列由10个核苷酸组成,多聚胸腺嘧啶Oligo(dT)序列由20个T碱基组成。
3.一种试剂盒,其特征在于,含有权利要求1或2所述核酸捕获探针。
4.一种血小板核酸文库的构建方法,其特征在于,方法为:
采集全血;
超纯血小板的分离;
血小板RNA的微量扩增:使用权利要求1或2所述核酸捕获探针;或权利要求3所述试剂盒中的核酸捕获探针进行微量扩增,获得血小板全长cDNA的扩增产物;
血小板核酸文库的构建。
5.如权利要求4所述血小板核酸文库的构建方法,其特征在于,所述采集全血为使用含抗凝剂的真空采血管采集静脉血,采集后轻轻颠倒采血管数次,使抗凝剂与全血充分混匀。
6.如权利要求4所述血小板核酸文库的构建方法,其特征在于,所述超纯血小板的分离为采用离心使所得超纯血小板中的白细胞污染率低于0.0001%;优选的,采用两步离心法;更优选的,在两步离心法中间采用双免疫磁珠去除白细胞和红细胞。
7.如权利要求4所述血小板核酸文库的构建方法,其特征在于,所述血小板RNA的微量扩增为以超纯血小板的RNA为模板,权利要求1或2所述核酸捕获探针,或权利要求3所述试剂盒中的核酸捕获探针为引物,利用反转录酶反转录合成与血小板的RNA互补的一链cDNA,并利用反转录酶的模板置换活性在一链cDNA的3'端加上一段扩增引物序列P1如SEQ IDNO.1所示;以合成得到的与血小板的RNA互补的一链cDNA为模板,如SEQ ID NO.4所示的扩增引物序列P2为引物,多轮扩增并纯化,获得血小板全长cDNA的扩增产物;优选的,可将多个不同样本的一链cDNA混合,在同一反应体系中进行扩增,获得不同来源的血小板全长cDNA的扩增产物。
8.如权利要求4所述血小板核酸文库的构建方法,其特征在于,所述血小板核酸文库的构建为使用转座酶和测序接头对所得的获得血小板全长cDNA的扩增产物进行片段化和加接头,使用测序引物对片段化产物进行PCR扩增,富集cDNA的5'端;利用AmPure XP Beads分选并纯化扩增产物,获得5'端携带分子标签的血小板核酸文库;优选的,其中,测序接头的序列如SEQ ID NO:4所示,测序引物的序列如SEQ ID NO:5和SEQ ID NO:6。
9.一种基因表达水平数据的获得方法,其特征在于,按照权利要求4-8任一所述方法构建血小板核酸文库后,对血小板核酸文库的片段进行高通量测序,利用样本标签对测序数据进行拆分,区分同一来源的血小板核酸数据,并对每个样本的测序数据进行质控、参考基因组比对、计算基因表达水平量的生物信息学分析,获得样本的基因表达水平数据。
10.一种分析血小板的基因表达水平的方法,其特征在于,对权利要求9获得的样本的基因表达水平数据进行分析,步骤如下:
学习样本库的建立:采用matlab的模块bioma.data.DataMatrix的生成n*m1的数据矩阵Cancer_healthy;
待测样本库的建立:采用matlab的模块bioma.data.DataMatrix的生成n*m2的数据矩阵Test_sample;
差异基因矩阵选取:调用matlab中的Bioinformatics Toolbox工具箱,分析数据矩阵Cancer_healthy中两种样本之间的差异基因,将差异基因进行选取得到一个m1*k的矩阵,及k*1的矩阵cancer_healthy_k1;
数据格式化处理:将Cancer_healthy及Test_sample矩阵根据差异基因矩阵cancer_healthy_k1匹配的差异基因做基因表达水平数据标准化处理和PCA主成分分析,并对最后的数据进行LDA线性判断降维成学习样本库降维矩阵m1*w和待测样本库降维矩阵m2*w;
高斯过程分类器进行判读:调用matlab中的gp工具箱,对上述经格式化处理的学习样本库降维矩阵m1*w和待测样本库降维矩阵m2*w建立数学模型,根据预测类型的概率X进行归类;
其中n为基因数,m1为由m1例健康和肺癌组成的样本数;m2为由m2例健康和肺癌组成的样本数;k为差异基因数,w为维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门生命互联科技有限公司,未经厦门生命互联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810782077.7/1.html,转载请声明来源钻瓜专利网。