[发明专利]基于关系抽取及知识推理的药物发现方法、装置及设备有效

专利信息
申请号: 202010923911.7 申请日: 2020-09-04
公开(公告)号: CN112017735B 公开(公告)日: 2023-08-22
发明(设计)人: 张圣;顾大中 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G16C20/70 分类号: G16C20/70;G06F40/279
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉;曹勇
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 关系 抽取 知识 推理 药物 发现 方法 装置 设备
【说明书】:

本申请涉及人工智能,揭示了一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备,其中方法包括:利用关系抽取模型获得物质‑基因实体对和基因‑疾病实体对的关系类型,根据物质‑基因实体对的关系类型计算物质靶向基因的第一可能性得分;根据基因‑疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;计算物质作为疾病的治疗物质的第三可能性得分。所述关系抽取模型可以储存在区块链中。本申请的方法,从海量的医学文献中自动抽取物质‑基因、基因‑疾病的关系类型,并利用知识推理药物具有治疗效果或者具有潜在治疗效果的物质,避免了基于化合物结构性质相似度的方案的高成本和低召回,可以获取更多潜在疗效的物质。

技术领域

本申请涉及到人工智能领域,特别是涉及到一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备。

背景技术

辅助药物研发的主要技术是发现或寻找对疾病有疗效或者有潜在治疗效果的物质,支撑后续的药物研发过程。目前对于药物发现的技术主要利用药理物质的化学结构以及性质的相似性发现新药,这种方式需要依赖高质量的知识丰富的化学物结构、性质、相互作用的知识库,构建成本极高,而且很多化合物新被研究出来的知识、性质无法被利用。

关于新药研发的另一个主要思路是从海量的文献中自动挖掘物质、疾病之间的治疗关系,从而发现候选的药物,不过这种方式挖掘到的很多都是已经存在的知识,对于药物发现的推动性不大。

目前,已经有相关技术利用医学知识图谱中的药物-靶标-疾病来寻找潜在的治疗药物,但关于物质-基因、基因-疾病等医学关系抽取的研究基本都是针对于二元关系抽取,没有判别给定物质-基因、基因-疾病实体对的具体的关系类型(靶标、致病、靶向治疗等具体的关系类型),无法很好的支撑药物发现。

发明内容

本申请的主要目的为提供一种基于关系抽取及知识推理的药物发现方法、装置和计算机设备,旨在解决目前的药物发现方案无法很好地发现潜在药物、成本高的技术问题。

为了实现上述发明目的,本申请提出一种基于关系抽取及知识推理的药物发现方法,包括:

利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型;

根据物质-基因实体对的关系类型计算物质靶向基因的第一可能性得分;

根据基因-疾病实体对的关系类型计算基因作为疾病的靶向基因的第二可能性得分;

通过相同的基因,关联得到物质-疾病实体对,根据所述第一可能性得分和所述第二可能性得分计算物质作为疾病的治疗物质的第三可能性得分;

当所述第三可能性得分大于预设阈值时,则认为物质为疾病的治疗药物。

进一步地,所述利用预设的关系抽取模型对包含物质-基因实体对或基因-疾病实体对的自然语句进行实体对关系抽取,获得物质-基因实体对的关系类型和基因-疾病实体对的关系类型的步骤,包括:

在医学资料库中获取包含物质-基因实体对或基因-疾病实体对的自然语句,对所述自然语句进行分词处理和依存关系分析;

利用预先训练的BERT模型对每一个词进行word embedding操作,得到词向量e-wordi

利用word2vec方法对每一个词进行Denpendecy embedding操作,得到依存向量e-depi

利用公式ei=(e-wordi:e-depi),i=1,..n将每个词的词向量和依存向量串联拼接起来得到每个词的向量表示ei,其中n表示分词后的词的总数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010923911.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top