[发明专利]一种基于密码子突变位点检测氨基酸突变的方法在审

专利信息
申请号: 202110582098.6 申请日: 2021-05-26
公开(公告)号: CN113380325A 公开(公告)日: 2021-09-10
发明(设计)人: 刘文佳;应南娇;李姗珊;邵梦洁 申请(专利权)人: 杭州电子科技大学
主分类号: G16B20/50 分类号: G16B20/50;G16B20/20;G16B40/00
代理公司: 杭州杭诚专利事务所有限公司 33109 代理人: 刘正君
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 密码子 突变 检测 氨基酸 方法
【说明书】:

本发明公开了一种基于密码子突变位点检测氨基酸突变的方法,其特征是,包括如下步骤:步骤S1:首先将数据进行预处理,获取原始密码子数据集C1;步骤S2:通过CMD算法获取单个碱基突变后的密码子数据集C2;步骤S3:通过CMD算法获得氨基酸数据集S1和S2;步骤S4:对氨基酸数据集S1和S2进行比对;步骤S5:输出氨基酸突变数据。本发明基于CMD密码子突变检测的机器学习算法对检测氨基酸突变进行检测,效率高且节约成本。本发明提出的CMD算法考虑了氨基酸的突变诱因,在理论上提高了检测的可信度。通过定位碱基突变来定位突变氨基酸,提高检测准确度。

技术领域

本发明涉及一种机器学习技术领域,尤其涉及一种基于密码子突变位点检测氨基酸突变的方法。

背景技术

氨基酸突变是由一些单个碱基的改变导致的。氨基酸突变包括同义突变,非同义突变和无义突变。同义突变表示单个碱基的改变并不影响其氨基酸序列翻译的蛋白质。非同义突变则表示单个碱基的改变会影响其氨基酸序列翻译的蛋白质,会改变蛋白质的稳定性、蛋白质之间的相互作用以及酶的活性,从而导致疾病的发生。最新的全人类基因组测序的结果表明,每个人都会有300-500万个氨基酸突变,这一数据仍在迅速增长。随着单核苷酸多态性等位基因分型和下一代DNA测序技术等基因组分析技术的快速发展,产生了大量关于氨基酸突变的数据。研究发现,绝大多数的氨基酸突变都会导致疾病发生。目前通过生物实验来测定突变表型和生物性质比较耗时耗力,且成本较高。采用机器学习的方法对突变数据进行检测,可以提高检测效率和准确性,且节约了大量成本。

已知密码子是指信使RNA分子中每相邻的三个核苷酸编成一组,在蛋白质合成时,代表某一种氨基酸的规律。信使RNA在细胞中能决定蛋白质分子中的氨基酸种类和排列次序。在信使RNA分子上的三个碱基能决定一个氨基酸。

目前使用机器学习算法和统计原理对氨基酸突变进行检测的方法包括:FunSAV、PolyPhen2、SIFT、SNAP和SusPect等。这些方法以氨基酸序列、3D结构、氨基酸的理化性质和进化信息等特征作为输入,已被做成软件或者网站供研究使用。但现有的方法检测精度不高,还需要进一步的改善。

例如,一种在中国专利文献上公开的“检测氨基酸突变的方法及系统”,其公告号CN106650314A,包括:构建蛋白质样本集;确定预筛选的特征,将同一样本的各个特征值整合到一条特征序列中组合构造成样本的初始特征集合;通过稳定性特征选择算法筛选出比较重要特征组合构造成样本的第一次筛选特征集合;然后通过序列前向选择算法筛选出重要特征组合构成样本的最终筛选特征集合;抽取正样本和负样本构建训练集和独立测试集,将训练集中各样本的最终筛选特征集合代入梯度提升树算法中进行训练,得出最终的分类模型,并结合独立测试集的最终筛选特征集合对分类模型的检测结果进行评估。但是,上述方案建立的训练方法需采取大量数据形成数据集,存在检测算法复杂,所需成本较高的问题。

发明内容

本发明是为了解决现有技术对氨基酸突变的检测方法采用生物实验来测定突变表型和生物性质,具有较高的盲目性耗时耗力,且成本较高的问题,提供一种基于密码子突变位点的CMD机器学习方法来检测氨基酸突变,提高氨基酸突变检测的效率和准确性.

为实现上述目的,本发明采用以下技术方案:

一种基于密码子突变位点检测氨基酸突变的方法,其特征是,包括如下步骤:

步骤S1:首先将数据进行预处理,获取原始密码子数据集C1

步骤S2:通过CMD算法获取单个碱基突变后的密码子数据集C2

步骤S3:通过CMD算法获得氨基酸数据集S1和S2

步骤S4:对氨基酸数据集S1和S2进行比对;

步骤S5:输出氨基酸突变数据。

作为优选,所述密码子数据集C1中储存了碱基位点信息,所述碱基位点信息包括:碱基位点所在的位置、碱基位点的起始位点、碱基位点的终止位点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110582098.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top