[发明专利]基于多视角深度特征与多标签学习的RNA结合蛋白识别有效
| 申请号: | 202010226916.4 | 申请日: | 2020-03-27 |
| 公开(公告)号: | CN111445944B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 邓赵红;杨海涛;吴敬;王蕾;王士同 | 申请(专利权)人: | 江南大学 |
| 主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/00;G06N3/0464 |
| 代理公司: | 大连理工大学专利中心 21200 | 代理人: | 戴风友 |
| 地址: | 214122 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视角 深度 特征 标签 学习 rna 结合 蛋白 识别 | ||
本发明属于智能细胞生物识别领域,涉及基于多视角深度特征与多标签学习的RNA结合蛋白识别。该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角数据构造、深度多视角特征提取模型和多标签分类器训练。初始多视角数据构造使用分子生物学原理和统计学原理将原始的RNA序列转换成氨基酸序列和二肽成分,获得氨基酸序列和二肽成分特征,然后和原始的RNA序列一起构建成初始多视角特征,为初始多视角特征构建模型。本发明基于最初的多视角数据,利用CNN进行深度学习来构造出深度多视角特征,相对于原始多视角特征,经过深度特征提取的多视角特征具有更小的数据维度和更高的分类效果。
技术领域
本发明属于智能细胞生物识别领域,涉及一种基于多视角深度特征与多标签学习的RNA 结合蛋白识别。
背景技术
RNA,全称核糖核酸,存在于生物细胞以及部分病毒、类病毒中的遗传信息载体之中,在生命体中主要起到调控编码基因表达的作用,同时也担任基因转录后合成蛋白质模板的角色,是生命体中不可缺少的成分。一条RNA想要顺利发挥其功能,一般需要借助RNA结合蛋白(RBP) 进行介导,所以缺少某种RBP可能会导致某类RNA无法发挥其调控或翻译的功能,从而使生命体缺少某些重要蛋白质或某些蛋白质异常增殖,影响自身机能。
RNA结合蛋白(RBP)是转录后事件的关键参与者,它们的RNA结合结构域的多功能性与结构灵活性使得RBP能够控制大量转录物的代谢。目前确定的人类RBP大约有1542种,占由细胞编码而成的所有蛋白质的7.5%。RBP几乎涉及转录后调控层的所有步骤,它们与其他蛋白质以及编码和非编码RNA建立高度动态的相互作用,产生称为核糖核蛋白复合物的功能单元,调节RNA剪切、多腺苷酸化、稳定性、定位、翻译和退化。研究发现,RBP在不同的癌症类型中失调,从而影响合成癌蛋白和肿瘤抑制蛋白RNA的模板功能,增加患癌风险和治疗癌症的难度。因此,破译RBP与其癌症相关RNA靶标之间错综复杂的相互结合网络将提供对肿瘤生物学的更好理解,并可能发现新的癌症治疗方法。值得一提的是绝大部分RNA都可以与不止一种RBP进行结合,所以寻找结合能力相似的RBP成为治疗RNA缺陷病和癌症的一个很重要的研究方向。
现在有很多方法可以利用机器学习模型从RNA序列中识别RBP结合位点,其关注点主要在于利用原始RNA序列的序列特征或结构特征来预测结合位点,很少有方法通过研究RNA与 RBP已有的结合信息来为预测提供帮助。如何将已有的RNA与RBP结合信息融入到训练样本中依然是一个重要的挑战。
发明内容
本发明实现了一种基于多视角深度特征与多标签学习的RNA结合蛋白识别,该方法包括训练阶段和使用阶段两部分,训练阶段包括初始多视角特征构建模型、深度多视角特征提取模型,多标签分类器训练和多视角决策分类。
训练阶段:初始多视角特征构建模型使用分子生物学原理和统计学原理将原始的RNA序列转换为氨基酸序列和二肽成分,获得序列的次序和成分特征,然后和原始的RNA序列一起构建成初始多视角特征,获得初始多视角特征构建模型;深度多视角特征提取模型构建出三个卷积神经网络,对初始的三个视角特征进行训练,以获得具有更好分类能力的深度多视角特征,得到深度多视角特征提取模型;提取到的深度特征用于训练CC多标签分类器,以学习到标签之间的关联,获得具有识别RNA结合蛋白能力的模型。
使用阶段:获取待测RNA序列,利用分子生物学原理和统计学原理构建出此条序列的初始多视角特征;再利用训练出来的三个卷积神经网络提取出3个视角的深度特征;接着使用训练出来的三个CC多标签分类器对这3个深度特征分别进行预测获得3组结果;最后使用多视角投票机制对这三组结果进行决策判断,得到最终的预测结果。
所述的基于多视角深度特征与多标签学习的RNA结合蛋白识别集合多视角深度学习技术和多标签学习技术,深度学习的深层次结构优化特征表示,多标签技术有效地利用每个标签的独立性和标签之间的相关性。将多视角深度学习技术和多标签学习技术有效结合可以充分提取RNA序列中的有效信息,提高分类器的泛化能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010226916.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种思想政治教育学习设备
- 下一篇:一种租车系统联动的控制方法





