[发明专利]一种结合最短依存路径的胶囊网络关系抽取模型在审
| 申请号: | 201910600327.5 | 申请日: | 2019-07-04 |
| 公开(公告)号: | CN110473595A | 公开(公告)日: | 2019-11-19 |
| 发明(设计)人: | 琚生根;孙界平;刘宁宁;熊熙 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G16B45/00 | 分类号: | G16B45/00;G16B50/10;G16B50/30;G06F16/28;G06Q10/04 |
| 代理公司: | 51304 成都东恒知盛知识产权代理事务所(特殊普通合伙) | 代理人: | 何健雄<国际申请>=<国际公布>=<进入 |
| 地址: | 610041 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 嵌入模块 胶囊 抽取 高层特征 信息丢失 嵌入层 语句 单词信息 动态路由 关系抽取 胶囊传送 前向信息 输入信息 网络关系 药物类型 药物实体 药物研发 动态的 解析器 输出层 网络层 低层 后向 信息量 高层 网络 | ||
本发明涉及药物研发技术领域,公开了一种结合最短依存路径的胶囊网络关系抽取模型,针对现有的药物关系抽取模型在长语句中抽取效果较差以及高层特征信息丢失的问题,现提出如下方案,其包括嵌入层、BiLSTM层、胶囊网络层、输出层,所述嵌入层包括原句嵌入模块和最短依存路径嵌入模块,原句嵌入模块的输入信息包含单词信息,位置信息以及药物类型信息,最短依存路径嵌入模块的输入是利用斯坦福解析器获取的两个药物实体之间的最短依存路径;BiLSTM由两个LSTM组成,分别获取语句的前向信息和后向信息。本发明利用胶囊网络的动态路由机制,动态的决定低层胶囊向高层胶囊传送的信息量,避免了高层特征信息丢失的问题,从而提升抽取效果。
技术领域
本发明涉及药物研发技术领域,尤其涉及一种结合最短依存路径的胶囊网络关系抽取模型。
背景技术
在药物相互作用是指药物之间存在的抑制或促进等作用,针对目前药物关系抽取模型在长语句中抽取效果较差以及高层特征信息丢失的问题,因此,需要一种结合最短依存路径的胶囊网络关系抽取模型来解决以上问题。
发明内容
本发明提出的一种结合最短依存路径的胶囊网络关系抽取模型,解决了现有的药物关系抽取模型在长语句中抽取效果较差的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种结合最短依存路径的胶囊网络关系抽取模型,包括:
嵌入层;通过原句嵌入模块和最短依存路径嵌入模块将输入文本语句转换为向量的形式输出得到原句嵌入向量;
BiLSTM层;采用两个BiLSTM分别获原句的向量表示h1和最短依存路径信息的向量表示hsdp,将二者拼接起来得到最终的向量表示hall;
胶囊网络层:分为低层胶囊层、动态路由层和高层胶囊层,胶囊网络利用动态路由机制将低层胶囊的信息动态的传送到高层胶囊中的,将高层胶囊输出向量的长度通过非线性压缩函数转换为0到1之间。
输出层;将具有最大向量长度的高层胶囊类别作为最终模型预测的类别。
优选的,所述嵌入层中文本语句转换为向量具体包括以下步骤:S1:输入原句为S={w1,w2,...,wn},采用词嵌入,位置嵌入和类型嵌入相结合的方法得到d代表单词嵌入的维度,p代表位置嵌入的维度,t代表类型嵌入的维度.则原句嵌入向量可以表示为S={x1,x2,...,xn}。
优选的,所述BiLSTM层中,将原语句与依存信息相结合,h1表示原语句的低层向量表示,hsdp表示最短依存路径信息的低层向量表示。
优选的,所述胶囊网络层,通过公式计算得到低层胶囊预测向量通过公式计算得到高层胶囊输入向量sj,通过得到高层胶囊网络的输出vj。
优选的,所述最终模型预测的类别为具有最大输出向量长度的高层胶囊对应的类别。
本发明的有益效果是:通过根据原语句解析出两个药物之间的最短依存路径,然后利用双向长短期记忆网络分别获取原语句和最短依存路径的低层向量表示,再将二者结合输入到胶囊网络中,利用胶囊网络的动态路由机制,动态的决定低层胶囊向高层胶囊传送的信息量,避免了高层特征信息丢失的问题,从而提升抽取效果。
附图说明
图1为本发明提出的一种结合最短依存路径的胶囊网络关系抽取模型的结构示意图。
图2为胶囊网络结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910600327.5/2.html,转载请声明来源钻瓜专利网。





