[发明专利]一种基于多头注意力的实体关系抽取方法在审
申请号: | 202310031342.9 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116384383A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 栾宁;赵琳;张震宇;冯曙明;王惠;林勇;曹杰;孙宏亮;汪皓天 | 申请(专利权)人: | 江苏电力信息技术有限公司;云境商务智能研究院南京有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06N3/049;G06N3/08;G06N3/0464 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
地址: | 210024 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多头 注意力 实体 关系 抽取 方法 | ||
1.一种基于多头注意力的实体关系抽取方法,其特征在于包括如下步骤:
步骤1,构建训练语料,基于通用领域获得的Glove英文词向量进行训练,获得词向量表示;
步骤2,使用Bi-LSTM编码词向量表示获得句子的上下文表示;
步骤3,通过多头注意力机制获得到句子的全局特征向量以及不同子空间的特征表示;
步骤4,将不同的子空间通过矩阵树定理生成对应的隐藏森林;
所述步骤4中,通过矩阵树定理生成隐藏森林的方法是:
步骤A41,将不同的子空间通过多头注意力来计算各个子空间中对应的边分数和根分数;
步骤A42,将边分数和根分数作为输入,计算每个边的边际概率来生成隐藏森林;
步骤5,将隐藏森林以及句子学习到的全局特征向量放入图卷积神经网络GCN中进行编码,然后分别通过池化操作获得实体和句子的向量表示;
步骤6,将步骤5中的句子向量和步骤3的全局特征向量融合,再和实体向量进入全连接层得到最终向量表示;
步骤7,将步骤6中的最终向量表示通过分类器获取在关系标签上的概率分布,从而识别实体之间的关系类型。
2.如权利要求1所述的基于多头注意力的实体关系抽取方法,其特征在于:所述步骤2中,使用双向长短期记忆机制Bi-LSTM来获得上下文表示,根据下式获得句子的上下文表示h:
f(t)=σ(Wfht-1+Ufxt+bf) (1)
i(t)=σ(Wiht-1+Uixt+bi) (2)
a(t)=tanh(Waht-1+Uaxt+ba) (3)
o(t)=σ(Woht-1+Uoxt+bo) (4)
c(t)=c(t-1)⊙f(t)+i(t)⊙a(t) (5)
h(t)=o(t)⊙tanh(c(t)) (6)
其中,xt表示时间t的输入,ht-1表示时间t-1的隐藏层状态,Wf、Wi、Wo和Wa分别表示特征提取过程中的遗忘门、输入门、输出门和ht-1的权值,系数Uf、Ui、Uo和Ua分别表示特征提取过程中的遗忘门、输入门、输出门和xt的权重系数,bf、bi、bo和ba分别表示遗忘门、输入门、输出门和特征提取过程中的偏置值,tanh是正切双曲函数,σ是激活函数Sigmoid;分别用和表示前向LSTM和后向LSTM的输出,对于第i个单词,将两个方向的输出组合起来表示:
3.如权利要求1所述的基于多头注意力的实体关系抽取方法,其特征在于:所述步骤3的具体内容是:
采用多头注意力机制从不同角度捕获输入句子的特征,设置多头注意力机制的头数与不同子空间个数相等,每一个头对应一个角度的子空间结构;每一个子空间用邻接矩阵进行表示;根据下式计算邻接矩阵中关系节点间的权重:
其中Q∈Rn×d,K∈Rn×d,V∈Rn×d分别表示查询query、键key、值value,d表示隐藏层的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏电力信息技术有限公司;云境商务智能研究院南京有限公司,未经江苏电力信息技术有限公司;云境商务智能研究院南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310031342.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:提供商品搜索信息的方法及电子设备
- 下一篇:LED芯片的制备方法及LED芯片