[发明专利]基于关系抽取及知识推理的药物发现方法、装置及设备有效
| 申请号: | 202010923911.7 | 申请日: | 2020-09-04 |
| 公开(公告)号: | CN112017735B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 张圣;顾大中 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G16C20/70 | 分类号: | G16C20/70;G06F40/279 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 关系 抽取 知识 推理 药物 发现 方法 装置 设备 | ||
本申请涉及人工智能,揭示了一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备,其中方法包括:利用关系抽取模型获得物质‑基因实体对和基因‑疾病实体对的关系类型,根据物质‑基因实体对的关系类型计算物质靶向基因的第一可能性得分;根据基因‑疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;计算物质作为疾病的治疗物质的第三可能性得分。所述关系抽取模型可以储存在区块链中。本申请的方法,从海量的医学文献中自动抽取物质‑基因、基因‑疾病的关系类型,并利用知识推理药物具有治疗效果或者具有潜在治疗效果的物质,避免了基于化合物结构性质相似度的方案的高成本和低召回,可以获取更多潜在疗效的物质。
技术领域
本申请涉及到人工智能领域,特别是涉及到一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备。
背景技术
辅助药物研发的主要技术是发现或寻找对疾病有疗效或者有潜在治疗效果的物质,支撑后续的药物研发过程。目前对于药物发现的技术主要利用药理物质的化学结构以及性质的相似性发现新药,这种方式需要依赖高质量的知识丰富的化学物结构、性质、相互作用的知识库,构建成本极高,而且很多化合物新被研究出来的知识、性质无法被利用。
关于新药研发的另一个主要思路是从海量的文献中自动挖掘物质、疾病之间的治疗关系,从而发现候选的药物,不过这种方式挖掘到的很多都是已经存在的知识,对于药物发现的推动性不大。
目前,已经有相关技术利用医学知识图谱中的药物-靶标-疾病来寻找潜在的治疗药物,但关于物质-基因、基因-疾病等医学关系抽取的研究基本都是针对于二元关系抽取,没有判别给定物质-基因、基因-疾病实体对的具体的关系类型(靶标、致病、靶向治疗等具体的关系类型),无法很好的支撑药物发现。
发明内容
本申请的主要目的为提供一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备,旨在解决目前的药物发现方案无法很好地发现潜在药物、成本高的技术问题。
为了实现上述发明目的,本申请提出一种基于关系抽取及知识推理的药物发现方法,包括:
利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型;
根据物质-基因实体对的关系类型计算物质靶向基因的第一可能性得分;
根据基因-疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;
通过相同的基因,关联得到物质-疾病实体对,根据所述第一可能性得分和所述第二可能性得分计算物质作为疾病的治疗物质的第三可能性得分;
当所述第三可能性得分大于预设阈值时,则认为物质为疾病的治疗药物。
进一步地,所述利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型的步骤,包括:
在医学资料库中获取包含物质-基因实体对或基因-疾病实体对的自然语句,对所述自然语句进行分词处理和依存关系分析;
利用预先训练的BERT模型对每一个词进行word embedding操作,得到词向量e-wordi;
利用word2vec方法对每一个词进行Denpendecy embedding操作,得到依存向量e-depi;
利用公式ei=(e-wordi:e-depi),i=1,..n将每个词的词向量和依存向量串联拼接起来得到每个词的向量表示ei,其中n表示分词后的词的总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010923911.7/2.html,转载请声明来源钻瓜专利网。





