[发明专利]基于stacking集成的RNA中N6 有效
| 申请号: | 202010021486.2 | 申请日: | 2020-01-09 |
| 公开(公告)号: | CN111161793B | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 于彬;禹昭敏;王磊;陈瑞欣 | 申请(专利权)人: | 青岛科技大学 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B20/30;G16B30/10;G16B40/00 |
| 代理公司: | 昆明普发诺拉知识产权代理事务所(特殊普通合伙) 53209 | 代理人: | 葛玉军 |
| 地址: | 266100 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 stacking 集成 rna base sup | ||
本发明公开了基于stacking集成的RNA中N6‑甲基腺苷修饰位点预测方法,涉及系统生物学领域。通过6种特征提取方法提取酿酒酵母、智人和拟南芥3个物种的RNA序列特征,通过特征融合得到原始数据集的初始特征空间;利用弹性网络对其进行降维,剔除冗余、噪声特征,保留对模型分类相关的重要特征,得到最佳特征集合;把最优特征子集以及所对应的类别标签输入到stacking集成中进行模型训练,并结合评价指标评估模型的预测性能,得到预测模型;将测试集中待预测的RNA序列,输入至预测模型中,预测m6A位点并输出。此模型在测试集上的预测准确率分别达到92.30%和87.06%,在跨物种预测方面具有很好的发展潜力,可成为鉴定m6A位点的有用工具。
技术领域
本发明属于系统生物学领域,涉及一种基于stacking集成的RNA中N6-甲基腺苷修饰位点预测方法。
背景技术
人类基因组计划的完成大大促进人们对遗传组织信息、传递和表达规律的认识,同时使我们意识到细胞内遗传信息表达机制的异常复杂性。RNA作为中心法则的关键环节,将遗传物质DNA和生命活动的执行者蛋白质紧密相连。研究表明,RNA中存在100多种化学修饰,这些化学修饰以甲基化修饰为主,包括:5-甲基胞嘧啶(m5C)、N1-甲基腺嘌呤(m1A)、5-羟甲基胞嘧啶(hm5C)、假尿嘧啶(ψ),N6-甲基腺嘌呤(m6A)等。在20世纪70年代发现的N6-甲基腺苷(m6A)是一种常见的转录后RNA修饰,随后的研究陆续证实了该修饰广泛存在于动植物、细菌以及病毒在内的多个物种中。
作为一个动态和可逆的过程,m6A发生在腺嘌呤的第六个氮原子上,其动态变化可以通过调节多种与RNA相关的细胞信号通路影响基因表达和细胞命运,在mRNA剪接、输出、稳定、免疫耐受、RNA转录、加工、细胞分裂以及细胞分化等生物过程中发挥重要作用。此外,m6A修饰与人类疾病密切相关,包括:癌症、病毒感染和脑部发育异常。因此,准确识别m6A位点对于RNA甲基化修饰基础研究,对了解疾病机制和药物开发都至关重要,而且具有推动生物信息学发展的作用。用于鉴定RNA序列中m6A位点的方法有:二维薄层色谱,高效液相色谱和高通量方法(如m6A-seq和MeRIP-Seq)。然而,用于靶向m6A位点的纯生化实验方法非常昂贵、耗时,随着先进测序技术和基因组计划的发展,积累了大量的RNA序列,许多研究人员提出基于机器学习算法的有效计算方法,用于快速准确的预测m6A位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010021486.2/2.html,转载请声明来源钻瓜专利网。





