[发明专利]药物设计中配体分子特征筛选装置和筛选方法在审
申请号: | 201810173915.0 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108399316A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 胡海峰;孙怡 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 徐振兴;姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配体分子 特征筛选 任务学习 药物设计 作用因素 子结构 配体 虚拟 筛选 配体相互作用 关键因素 模型构造 筛选模型 药物靶标 药物分子 鲁棒性 样本量 构建 鲁棒 发现 | ||
1.一种药物设计中配体分子特征筛选方法,其特征在于,包括如下步骤:
(1)获取所需要的初始数据集;
(2)配体分子的特征生成;
(3)获取各个配体药物靶标作用的活性值;
(4)利用多任务学习的方法,进行特征筛选。
2.如权利要求1所述的药物设计中配体分子特征筛选方法,其特征在于,步骤(1)中,所述初始数据集包括生成配体分子特征所需要的smiles,以及得到活性值standard values,并对所得到的活性值v,取-lgv。
3.如权利要求2所述的药物设计中配体分子特征筛选方法,其特征在于,步骤(2)具体包括如下分步骤:
(2.1)对于原始数据集,我们有t个任务,n个样本,每个样本有d维特征;
(2.2)步骤(1)中,从数据库得到初始数据集{x1,…,xn};
(2.3)将得到的配体分子,在这里是各个主体的smiles,利用分子指纹的方法,得到相对应的特征;
(2.4)我们把X=[x1…xn]T∈Rn×t作为输入的数据特征矩阵。
4.如权利要求3所述的药物设计中配体分子特征筛选方法,其特征在于,步骤(3)进一步包括步骤:
(3.1)读取各配体分子所作用的活性值standard values;
(3.2)我们把Y=[y1…yn]T∈Rn×t作为输入。
5.如权利要求4所述的药物设计中配体分子特征筛选方法,其特征在于,步骤(4)进一步包括步骤:
(4.1)通过多任务学习的算法,对于输入的X,Y矩阵进行优化;
(4.2)构建损失函数模型,求得权重矩阵W,W=[w1,…wt]∈Rn×t;
(4.3)得到特征筛选的结果。
6.一种药物设计中配体分子特征筛选的装置,其特征在于,所述特征筛选装置包括:
初始模块,用于从数据库得到初始数据集;
配体特征生成模块,用于得到配体分子的特征矩阵;
配体作用活性值生成模块,用于得到各个配体分子所作用的活性值;
基于LASSO的多任务学习算法模块,用于构建损失函数,优化模型,得到权重矩阵,进而得到我们所需要的特征筛选的结果。
7.如权利要求6所述的药物设计中配体分子特征筛选的装置,其特征在于,所述初始模块还包括,对配体分子生成所需smiles的获取模块,对活性值standard values的获取模块。
8.如权利要求6所述的药物设计中配体分子特征筛选的装置,其特征在于,所述特征生成模块还包括配体分子的优化与处理模块,用于对原始数据进行整理,筛除出重复的,无活性值的配体分子。
9.如权利要求6所述的药物设计中配体分子特征筛选的装置,其特征在于,所述配体作用活性值生成模块还包括,对活性值数据整理模块,统一相同的单位,对于重复的配体分子的活性值,求取平均值。
10.如权利要求6所述的药物设计中配体分子特征筛选的装置,其特征在于,所述基于LASSO多任务学习算法生成模块还包括算法模型的选择,加入LASSO,考虑任务与任务,个体与个体之间的相关性,提高了模型的鲁棒性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810173915.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种Bcr-Abl蛋白激酶抑制剂的筛选方法
- 下一篇:计费式授权管理方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用