[发明专利]一种基于异构网络的GPCR药物和靶向通路的预测方法有效

专利信息
申请号: 201910132743.7 申请日: 2019-02-21
公开(公告)号: CN110021341B 公开(公告)日: 2023-02-17
发明(设计)人: 江振然;蒋惠炎 申请(专利权)人: 华东师范大学
主分类号: G16B15/30 分类号: G16B15/30;G16B40/00;G16B50/00
代理公司: 上海德禾翰通律师事务所 31319 代理人: 夏思秋
地址: 200062 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于异构网络的G蛋白偶联受体(G‑Protein Coupled Receptor,GPCR)药物和靶向通路的预测方法及其生物学用途。该方法基于药物的化学子结构特征、基于药物的SMILES字符串信息特征、通路相关的蛋白质序列特征及通路相关疾病的表型特征的基础上,进而建立药物‑通路异构网络模型,并使用深度置信网络的方法预测药物‑通路相互作用关系。本发明提出的基于异构网络的GPCR药物和靶向通路的预测方法不仅预测精度高,鲁棒性好,而且可以成功预测出部分GPCR药物所作用的通路。该方法可用于药物‑通路相关性评估及临床患者用药参考等用途。
搜索关键词: 一种 基于 网络 gpcr 药物 靶向 通路 预测 方法
【主权项】:
1.一种基于异构网络模型的GPCR药物和靶向通路预测方法,其特征在于,所述预测方法包括以下步骤:步骤1:构建药物和通路特征矩阵构建药物特征矩阵A1:计算药物的化学子结构相似性药物的化学特性相似性是基于药物的化学子结构的相似性;首先,化学子结构从KEGG数据库中获得,然后运用公式(1)来计算两个药物之间的化学特性相似性,得到化学特性相似性矩阵Smol公式(1)为两个药物di和dj之间的化学子结构相似性的计算方法,其化学子结构从KEGG数据库得到,且用0或1表示化学指纹信息的每一维载体,最终每个药物可以得到881维载体,Structure_mol(d)代表药物化学子结构指纹信息的有效位,相当于两个药物指纹的Jaccard score值;A2:计算药物的SMILES字符串信息相似性药物的SMILES特征,它主要用来描述药物的字符串结构规范;首先,通过KEGG数据库中的药物找到PubChem数据库中药物的CID,这些药物的CID提供了其化学结构的SMILES字符串信息,然后,得到这些药物的SMILES字符串信息,并用TF‑IDF方法度量其相似性;SMILES字符串相似度是SMILES字符串信息本身之间的相似性,其主要通过文本挖掘的TF‑IDF算法计算得到;基于文本的TF‑IDF方法可以通过公式(2)表示:公式(2)为基于文本挖掘的TF‑IDF算法计算得到的SMILES字符串信息相似性方法;w表示某个SMILES字符串信息,其中分母加1是为了防止分母为0;TF‑IDF算法倾向于过滤掉无用的SMILES字符串信息,保留重要的SMILES字符串信息;采用Stf表示药物的SMILES字符串信息特征,并以此作为新加入的药物特征矩阵;构建通路特征矩阵B1:计算通路相关疾病的表型相似性通路相关疾病的表型特性相似性为基于通路空间中药物可治疗的疾病或适应症的相似性;计算疾病的表型相似性,首先通过疾病ID可以得到对应MeSH数据库中的MeSH ID,然后提取每种疾病涉及的MeSH实体属性,接着根据MeSH语义分析的方法来计算通路中相关疾病的表型特征相似性,最后结合通路‑疾病关系矩阵,计算得到Smt作为通路的疾病表型的相似性矩阵;B2:计算通路相关蛋白序列相似性通路相关蛋白序列相似性为基于通路空间中通路相关的靶标蛋白序列的相似性;从Uniprot数据库中找到通路联系的蛋白质序列,并把这些序列进行序列比对,然后找出最相似的那一条序列用于表示这条通路;最后通过公式(3)计算出两条通路相关的蛋白序列的相似性,得到的结果为所有通路相互关联的蛋白质序列相似性的集合;蛋白质序列可以通过序列比对算法得到,序列比对的含义就是度量元素间相似性的尺度;并可以运用公式(3)来计算两条通路之间的蛋白序列相似性;公式(3)为两个蛋白序列R和T基于一个概率模型来计算靶标蛋白的序列相似性的计算方法;R[i],T[j](0≤i≤|R|,0≤j≤|T|)表示两个蛋白质序列,且都属于所有所述通路相关的蛋白质序列的字符集;对于字符集中的元素或空的字符,并用σ表示两个蛋白序列的相似性得分,F(i,j)表示蛋白序列R的前缀和序列T的前缀之间的最优相似性的比较得分,从而可以得到蛋白质序列的得分矩阵,最后结合通路‑蛋白质序列关系矩阵,计算得到Sp作为通路中有关蛋白序列相似性的矩阵;步骤2:构建药物‑通路预测模型C1:建模并预测通过计算得到药物的特征矩阵Sd,其是药物的化学子结构特征Smol与药物的SMILES字符串信息特征Stf的线性组合,用公式(4)计算得到:Sd=0.5*Smol+0.5*Stf                公式(4)通路的特征矩阵Sy,其是基于疾病表型的通路特征Smt与基于蛋白质序列的通路特征Sp的线性组合,可以用公式(5)计算得到:Sy=0.5*Smt+0.5*Sp                 公式(5)以及药物‑通路关系标签矩阵,将三种矩阵结合构建异构网络模型,并运用深度置信网络方法对药物‑通路的异构网络模型进行药物‑通路关系预测,从而分别得到各疾病类型模型所对应的AUC值,概率分布预测值和参数分布情况。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910132743.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top