[发明专利]用于发现中药活性成分及其作用靶点的网络药理学方法有效
申请号: | 201310054028.9 | 申请日: | 2013-02-20 |
公开(公告)号: | CN103150490A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 黄剑平;范骁辉 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 发现 中药 活性 成分 及其 作用 网络 药理学 方法 | ||
技术领域
本发明涉及计算机辅助药物设计领域,特别涉及一种基于化合物和蛋白质相似性、用于发现中药活性成分及其作用靶点的网络药理学方法。
背景技术
中药具有多成分、多靶点协同整体作用的特点,各个成分和靶点之间的关系所呈现的其实是一种复杂的网状结构。但是,长久以来,中药研发基本上都是把药物作为单一扰动因素,并以此为基础研究其与生物应答系统的关系(“点-系统”),不能很好地反映中药干预系统与生物应答系统之间的交互关系(“系统-系统”),使之难以明确中药的药效物质群并进行复方的配伍优化。而且,大多数中药研发所采用的基于化学成分分离和简单的活性成分筛选相结合的方法,难以真正阐释中药的科学内涵。
近年来出现的网络药理学,突破了传统“单药物,单靶点”药物研发模式的瓶颈,并提供了一种基于“多药物,多靶点”相互作用关系的药物研发新模式和新思路,这与中药的多成分、多靶点、多途径等特点正好吻合,因此,借鉴网络药理学的理念和方法进行中药研发,有可能为中药药效物质基础研究和相应靶点发现等带来前所未有的机遇。
而且,放眼全球还可以发现,由于in silico技术的应用,世界范围内的药物研发费用减少了约一半左右,所以,in silico技术的投入在整个药物研发的投入上所占比例也越来越大,到2016年将达20%左右(I.M.Kapetanovic,Chemico-biological interactions,2008.171(2),p.165-176)。特别是在临床前研究阶段,使用计算机辅助药物设计手段进行药物虚拟筛选和优化设计可以大幅度降低费用并提高效率。但是,目前in silico技术在中药研发中所占的比重还非常低,其应用价值还不能很好体现。在进行传统实验之前,如果能够发展和推广使用in silico技术、并选择与中药的特点较为吻合的理念和模式进行评价筛选,对于中药现代化将有着重大意义。
发明内容
本发明的目的是针对中药多成分、多靶点协同整体作用的特点,提供一种结合网络建模技术、基于化合物和蛋白质相似性、用于发现中药活性成分(化合物)及其作用靶点(蛋白质)的方法,以提高中药活性成分及其作用靶点的筛选准确率和效率。
一种用于发现中药活性成分及其作用靶点的网络药理学方法,包括:
(A)收集用于构建训练集的化合物、蛋白质(潜在的作用靶点)和它们之间的相互作用数据;该步骤中收集的化合物和作为潜在靶点的蛋白质取自于Drugbank数据库。
(B)分别获取所述化合物的分子结构和所述蛋白质的氨基酸序列;该步骤中化合物的分子结构和蛋白质的氨基酸序列均从Drugbank数据库获取,其中化合物的分子结构为SDF格式;
(C)根据所述化合物的分子结构计算化合物的分子描述符,根据所述蛋白质的氨基酸序列计算蛋白质的特征描述符;
(D)根据所述分子描述符和特征描述符以及两者之间的相互作用数据构建训练集;
(E)基于所构建的训练集,使用机器学习方法建立化合物和蛋白质相互作用预测模型;
(F)对需要预测的中药,收集其已知的化合物成分,计算所述化合物成分的分子描述符,连同步骤(C)中得到的蛋白质的特征描述符构建预测集;
(G)使用所述预测模型对所述预测集进行预测,所述的预测结果表示化合物和蛋白质之间是否存在相互作用;
(H)根据步骤(G)得到的模型预测结果构建化合物和蛋白质相互作用网络;
(I)通过对所述网络分析,得到需要预测的中药的潜在活性成分和相应靶点。
为便于计算,作为优选,步骤(C)中所述分子描述符可选择通过Dragon软件计算得到;所述特征描述符通过PseAAC工具(伪氨基酸组成工具,Pseudo Amino Acid Composition,可参考文献HB Shen & KC Chou,Analytical Biochemistry,2008,373(2),p.386–388)工具计算得到。
为提高预测精度和预测过程的稳定性,作为优选,所述步骤(C)中得到分子描述符后,对得到的每一个分子描述符进行如下判断,若满足如下条件之一则剔除该分子描述符:(1)该分子描述符中含有无效值;(2)该分子描述符中零值比例大于设定比例;(3)该分子描述符的标准差小于设定标准差。
所述步骤(D)中,根据所述分子描述符和特征描述符构建训练集时:其中的独立变量为计算获得的分子描述符和特征描述符,因变量为化合物和蛋白质之间的相互作用关系,具体构建步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310054028.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:拦截应用程序中的植入信息的方法及装置
- 下一篇:轮胎防滑链
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用