[发明专利]基于突变信息的蛋白相互作用影响判断方法有效

专利信息
申请号: 201911365559.3 申请日: 2019-12-26
公开(公告)号: CN111128300B 公开(公告)日: 2023-03-24
发明(设计)人: 林关宁;钱威 申请(专利权)人: 上海市精神卫生中心(上海市心理咨询培训中心)
主分类号: G16B25/00 分类号: G16B25/00;G16B30/00;G16B40/00
代理公司: 上海容慧专利代理事务所(普通合伙) 31287 代理人: 于晓菁
地址: 200030 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 突变 信息 蛋白 相互作用 影响 判断 方法
【权利要求书】:

1.一种基于突变信息的蛋白相互作用影响判断方法,其特征在于,包括数据收集筛选、特征选取提取和模型建立三部分,其中:

在数据收集筛选步骤,使用预设的数据集,将该数据集根据研究需要进行筛选,选取人类的蛋白序列点突变条目并排除矛盾标注条目,获得符合条件的注释条目,这些条目中包含了三类基因点突变对于蛋白互作的影响种类,分别为破坏原有互作、减弱原有互作、对原有互作无影响;

在特征选取提取步骤,特征选取为蛋白序列特征和序列保守性特征,通过深度学习模型训练将序列中的定量特征进行映射计算得到,序列保守性特征作为对于序列特征的补充,保守性数值通过NCBI Psiblast序列比对工具进行初步计算,得到蛋白序列特异性得分矩阵,进一步处理提取相关区段得到保守性相关特征;

在模型建立步骤,使用深度学习中的卷积神经网络模型,卷积神经网络模型包含卷积层、激活层和全连接层,卷积层通过设置多个卷积核对原有特征进行提取和计算,激活层将线性计算非线性化,全连接层在不同神经元节点中进行线性映射运算,最终给出突变对于互作影响的分类结果;卷积神经网络模型使用卷积神经网络作为基础,并进行调整以适应具体任务,从不同尺度对于输入进行特征提取识别,在最后给出综合判断结果。

2.如权利要求1所述基于突变信息的蛋白相互作用影响判断方法,其特征在于,在特征选取提取步骤,将经过数据清洗的注释条目进行特征提取工作,具体步骤如下:

(1)蛋白序列特征,以突变发生位置作为中心参考位点,选取前几十个以及后几十个位氨基酸残基作为参考,得到突变相关氨基酸滑动窗序列作为数据样例,将得到的滑动窗序列进行独特编码,将序列按照分布转化为数字矩阵,并添加特定指示列提示该位点是否存在氨基酸信息;

(2)蛋白序列保守性特征,该类特征的提取依赖于NCBI Psiblast工具,输入发生突变的蛋白序列信息,在对比库中存在多物种参考蛋白序列集,通过序列对比参考库对比该蛋白序列的相似序列,得出该蛋白序列各点位的氨基酸特异性打分矩阵,其中包含蛋白序列各氨基酸残基位点的保守性信息,通过发生突变的氨基酸点位进行定位,取前几十位以及后几十位氨基酸作为参考,形成数据样例,并经过一系列标准化处理,得到突变相关氨基酸保守性特征。

3.如权利要求1或2所述基于突变信息的蛋白相互作用影响判断方法,其特征在于,在模型建立步骤,针对模型正负样本数量比例严重不平衡从而导致分类效果较差的问题,引入类别差异损失权重对该问题进行平衡,即对样本数量少的类别误判惩罚高于样本数量多的类别,在模型训练过程中选取模型损失函数值最小的训练模型作为最优模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市精神卫生中心(上海市心理咨询培训中心),未经上海市精神卫生中心(上海市心理咨询培训中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911365559.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top