[发明专利]一种快速导出末端限制性片段长度多态数据的方法在审
| 申请号: | 201811586324.2 | 申请日: | 2018-12-24 |
| 公开(公告)号: | CN109712673A | 公开(公告)日: | 2019-05-03 |
| 发明(设计)人: | 吕作鹏;梁家卓;袁博;储云博 | 申请(专利权)人: | 江苏师范大学 |
| 主分类号: | G16B45/00 | 分类号: | G16B45/00;G06K9/00 |
| 代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 杜春秋 |
| 地址: | 221116 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 导出 末端限制性片段 长度多态 处理数据 导出数据 人工挑选 数据合并 统计分析 常规的 图谱 保存 语言 统计 | ||
本发明涉及一种快速导出末端限制性片段长度多态数据的方法,包含有以下几个步骤:第一步、统计分析原始T‑RFLP数据;第二步、数据的导出和保存;第三步、数据的R统计语言进行数据合并和计算。与常规的利用Genemapper软件处理数据相比较,本方法更加快速,可以实现批量处理与导出数据,减少人工挑选图谱的误差。
技术领域
本发明涉及一种快速导出末端限制性片段长度多态数据的方法,具体涉及到功能微生物末端限制性片段长度多态数据的整合及快速导出;本发明属于生物统计学领域。
背景技术
末端限制性片段长度多态分析(T-RFLP)是研究微生物生态的重要工具,其原理是根据基因序列保守区设计引物,其中一个引物5’端用荧光标记,通过PCR进行扩增,PCR产物经过限制性内切酶的消化后产生酶切片段,酶切片段通过测序仪进行基因扫描,扫描得到的信号强弱通过峰进行定量分析。不同长度的酶切片段代表不同种类的微生物,通过检测和定量得到微生物群落组成情况和相对丰度。
末端限制性片段长度多态是分析功能微生物群落组成和相对丰度的工具,酶切后的数据在ABI测序仪产生的数据通常需要过程繁琐的提取、鉴定和分类等过程,目前主要通过人工操作完成,但是人工操作过于繁琐而且容易出错,特别是对于大通量的数据样品几乎无法靠人工来完成,如图1所示。本发明是基于Genemapper软件导出数据繁琐,谱图校正困难等问题,利用色谱中常用的高斯函数对谱图进行拟合,提高数据导出的质量和效率。该技术的创新点在于基于高斯函数用R统计对T-RFLP谱图进行批量校正、拟合、导出并实现数据处理可视化,易于操作。
发明内容
本发明所要解决的技术问题是,克服现有技术的缺点,提供一种快速导出末端限制性片段长度多态数据的方法。
为了解决以上技术问题,本发明提供一种快速导出末端限制性片段长度多态数据的方法,其特征在于包含有以下几个步骤:
第一步、统计分析原始T-RFLP数据
第1.1步骤、去除噪音峰图
利用标准物的峰高的最高值和最低值选择待测样品范围,将小于标准品最低值的峰高和大于标准品峰高的值去除;
第1.2步骤、校正与拟合重叠峰面积
(s1)、对重叠峰进行高斯函数校正可取得较好的校正效果,该数学模型为:
(s2)、上式简化为:
h(t)=S×Z(σ,τ,tg,t);
其中,S为峰面积,tg、σ为高斯峰的中心位置与标准偏差,τ为指数衰减时间常数,t′为积分变量;
(s3)、保留时间为tR1和tR2的两个单峰发生部分重叠,构成峰顶时间分别为tP1和tP2,峰高为H1和H2的复合峰,假设两个峰拟合后面积分别为S1和S2,根据高斯函数得:
简化为:
从而峰面积可以计算得出:
通过归一化校正后的峰面积S拟合得到真实峰面积S′:
第二步、数据的导出和保存;
经过第一步对T-RFLP图谱的杂峰进行去噪处理后,得到高质量的谱图,使数据更加准确。
第三步、数据的R统计语言进行数据合并和计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏师范大学,未经江苏师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811586324.2/2.html,转载请声明来源钻瓜专利网。





