[发明专利]通过计算机程序模拟产生简化DNA甲基化测序数据的方法有效
| 申请号: | 201710576797.3 | 申请日: | 2017-07-14 |
| 公开(公告)号: | CN107451419B | 公开(公告)日: | 2020-01-24 |
| 发明(设计)人: | 陆燕;孙喜伟;刘鹏渊;周莉媛 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B5/00 |
| 代理公司: | 33200 杭州求是专利事务所有限公司 | 代理人: | 刘静;邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通过 计算机 程序 模拟 产生 简化 dna 甲基化 序数 方法 | ||
本发明公开了一种通过计算机程序模拟产生简化DNA甲基化测序数据的方法,可以用来评估不同简化基因组甲基化(RRBS)测序数据比对软件的效率以及相应数据分析平台的可靠性,以此来确定最优的比对方法及相应的最优参数。本发明通过计算机程序模拟RRBS文库构建和测序过程,根据CpGs甲基化水平的分布,产生与真实RRBS测序数据非常相近的仿真数据。该仿真数据除了模拟单个碱基水平的甲基化水平外,还模拟了真实数据的插入、缺失、单核苷酸变异和结构变异等其他特性以增加真实性。此外,本发明在模拟RRBS测序过程中,通过引入经验误差模型来模拟测序过程中出现的误差,进一步增加了仿真数据的真实性。
技术领域
本发明属于计算机技术模拟产生简化DNA甲基化测序数据(生物信息学) 领域,具体涉及使用计算机程序模拟产生高仿真的简化DNA甲基化测序数据的方法。
背景技术
DNA甲基化是指在DNA序列不改变情况下,通过DNA化学修饰影响生物过程或者改变遗传表型。近年来,随着研究的深入,研究者发现DNA甲基化作为一种重要的表观遗传学修饰,其在肿瘤的形成发生发展过程中扮演重要角色。除此之外,研究也表明DNA甲基化还可能参与X染色体沉默,基因组印记,转座子沉默和干细胞分化等重要生物过程。因此,准确检测基因组上差异甲基化区域(DMR)对研究包括肿瘤在内的一些复杂疾病有非常重要的作用。
随着二代测序迅猛发展以及测序成本的降低,基于高通量测序和亚硫酸盐处理的来研究甲基化的技术越来受到关注。其中最常见的是简化DNA甲基化测序技术(RRBS)。与此同时,各种基于RRBS测序数据的后期比对工具也随之发展,层出不穷;如何系统地评估这些比对工具的功效变得日趋重要。通常,由于真实RRBS测序数据的甲基化信息的实际情况无从得知,从而难以以此去评估相应的比对工具的可靠性;然而,使用计算机模拟的RRBS测序数据却可以通过自主设定参数从而得知模拟数据的“真实”甲基化信息,提供基础比较标准,从而能便捷有效地评估这些工具的表现,以此来确定最优的比对方法及相应的最优参数。
目前已知的甲基化测序数据模拟工具大多是基于先前的全基因组甲基化测序(WGBS)设计的,并不适合目前广泛使用的RRBS测序技术数据,而且这些工具除了模拟甲基化信息外没有模拟真实数据的其它特性。近来,也有一些基于RRBS测序的数据模拟工具,但是他们只是通过统计模型产生一些DNA甲基化数据,并非模拟实际测序得到的读长(reads)数据,这些数据自然也不能用来评估相应拼接工具的可靠性。
发明内容
本发明的目的在于针对现有技术的不足,提供一种通过计算机程序模拟产生简化DNA甲基化测序数据的方法,通过计算机程序模拟RRBS文库构建和测序过程,根据基因组上的CpGs甲基化水平的分布,产生与真实RRBS测序数据非常相近的仿真数据。其中,该过程引入了测序经验误差模型模拟测序出现的误差以增加仿真数据的真实性。该高仿真数据可以用来测试目前各种甲基化测序数据比对软件的功效,以此来确定最优的拼接方法及相应的最优参数,也可用于后续新的比对工具的辅助开发。
本发明的目的是通过以下技术方案来实现的:一种通过计算机程序模拟产生简化DNA甲基化测序数据的方法,具体包括以下四个步骤:
(1)模拟产生包含单碱基插入、缺失、单核苷酸变异和结构变异特性(变异参数可由用户设定)的参考基因组序列,比如hg19;
(2)在步骤(1)得到的参考基因组上模拟CpG二核苷酸位点上的甲基化水平:由于人类基因组上的CpG位点的甲基化水平通常服从Beta分布,所以使用Beta统计模型来产生CpG位点的甲基化数值;此外,考虑到真实数据中邻近CpG位点的强相关性,对100bp距离内的CpG位点的甲基化水平进行基于最大似然统计模型的修正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710576797.3/2.html,转载请声明来源钻瓜专利网。





