[发明专利]基于注意力机制神经网络的药物实体关系抽取方法及系统有效
申请号: | 201811510566.3 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109783618B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 张亮仁;杨波;刘振明;宗晓琳;胡建星 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 神经网络 药物 实体 关系 抽取 方法 系统 | ||
1.一种基于注意力机制神经网络的药物实体关系抽取方法,其特征在于,包括以下步骤:
(1)解析药化文献的文本内容,将文本内容以句子为基本单位分句,并对句子中的每个词进行向量化表示;
(2)将步骤(1)的向量化表示的结果输入循环神经网络,通过循环神经网络按照前后双向语序提取句子中各词的关联特征并识别各药物实体;
(3)通过注意力机制神经网络获得句子中的词间重要性权重,并将其与步骤(2)的输出合并;
(4)将步骤(3)得到的结果输入卷积神经网络,通过卷积神经网络对各药物实体词两两预测类别关系。
2.根据权利要求1所述的方法,其特征在于,步骤(1)解析文本内容得到的向量包含:词向量、位置向量、词性特征向量,将这三者合并作为步骤(2)中循环神经网络的输入向量。
3.根据权利要求2所述的方法,其特征在于,步骤(1)通过word2vec算法构造词向量、位置向量、词性特征向量。
4.根据权利要求1所述的方法,其特征在于,步骤(2)所述循环神经网络为双向长短期记忆网络。
5.根据权利要求1所述的方法,其特征在于,步骤(3)所述注意力机制神经网络为单层注意力机制前馈神经网络。
6.根据权利要求5所述的方法,其特征在于,步骤(3)所述词间重要性权重按如下公式计算:
其中,输入的词特征向量为:N为句子词数量,表示自然数,F表示输入的词特征向量的特征维度;待输出的重要性权重特征向量为:F'表示待输出的重要性权重特征向量的特征维度;eij表示词xj对词xi通过ReLU函数对两个词向量执行一次非线性变换计算获得的重要性信息;为权重矩阵,参数通过训练本层神经网络获得;aij为通过softmax函数正则化获得的词xi与句子中其它词的重要性权重关系向量。
7.根据权利要求1所述的方法,其特征在于,根据标记好的语料进行分类训练,得到所述循环神经网络,所述注意力机制神经网络,以及所述卷积神经网络的分类器的内部参数,所述内部参数包括权重矩阵参数及偏置矩阵参数;通过训练逐渐获得最优分类结果。
8.一种基于注意力机制神经网络的药物实体关系抽取系统,其特征在于,包括:
文献解析模块,负责解析药化文献的文本内容,将文本内容以句子为基本单位分句,并对句子中的每个词进行向量化表示;
文本内容分析模块,负责将所述文献解析模块得到的向量化表示的结果输入循环神经网络,通过循环神经网络按照前后双向语序提取句子中各词的关联特征并识别各药物实体;
注意力机制模块,负责通过注意力机制神经网络获得句子中的词间重要性权重,并将其与所述注意力机制模块的输出合并;
分类模块,负责利用所述注意力机制模块和所述文本内容分析模块的合并后的输出结果,通过卷积神经网络对各药物实体词两两预测类别关系。
9.根据权利要求8所述的系统,其特征在于,还包括分类器训练模块,负责训练所述基于卷积神经网络的分类器。
10.根据权利要求8所述的系统,其特征在于,所述循环神经网络为双向长短期记忆网络;所述注意力机制神经网络为单层注意力机制前馈神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811510566.3/1.html,转载请声明来源钻瓜专利网。