[发明专利]一种基于多层注意力机制的远程监督关系抽取方法有效

专利信息
申请号: 202110453297.7 申请日: 2021-04-26
公开(公告)号: CN113076391B 公开(公告)日: 2022-09-20
发明(设计)人: 刘琼昕;王佳升 申请(专利权)人: 北京理工大学
主分类号: G06F16/31 分类号: G06F16/31;G06F40/30;G06N5/02;G06N3/04;G06N3/08
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 王民盛
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多层 注意力 机制 远程 监督 关系 抽取 方法
【权利要求书】:

1.一种基于多层注意力机制的远程监督关系抽取方法,其特征在于,包括以下步骤:

S1:获取知识库,将知识数据集中的句子按包进行划分;

S2:获取句子的矩阵表示:

首先,令数据集中第i个包其中,表示包Bi的最后一个句子;令包Bi中第j个句子其中,lij表示句子的词语数量;令句子的头实体的位置为其中,为头实体出现的次数;令句子的尾实体的位置为其中,为尾实体出现的次数;

然后,将头实体位置和尾实体位置进行组合得到其中

对于句子中的每一个单词利用Embedding技术,计算其所有的位置特征:其中,表示单词相对于头实体的第个位置特征向量,表示单词相对于尾实体的第个位置特征向量,表示实数域内维度为dp的向量空间;

通过公式(1),计算词语的中最终向量表示集合其中:

其中,表示集合中的第l个向量,是词语的嵌入式词向量,表示实数域内维度为dw的向量空间,d表示最终向量表示维度,d=dw+2dp,其中,dw表示嵌入式词向量的维度,dp表示位置特征向量的维度;

通过公式(2),计算句子矩阵表示集合其中:

其中,表示集合的第l个矩阵,表示句子的第k个词语的第l个最终向量表示,1≤k≤lij,lij为句子的词语数量;

S3:通过句子编码器,获取句子的特征向量;

对于句子的每一个矩阵表示用一个含有m个卷积核{f1,f2,...,fm}的分段卷积神经网络,得到X的向量表示,其中,fm表示第m个卷积核,每一个卷积核1≤i≤m,表示实数域内尺寸为l*k的矩阵空间,l表示卷积核的长度,k表示卷积核的宽度,表示矩阵集合的第l个矩阵,

首先,通过m个卷积核提取卷积特征cij

cij=fi*wj-l+1:j (3)

其中,1≤i≤m,1≤j≤|X|+l-1,wj-l+1:j表示矩阵X的第j-l+1行到第j行对应向量构成的矩阵,|X|表示矩阵表示X的行数;*为卷积操作;经过卷积后,得到矩阵

然后,对于每个卷积核fi对应的卷积结果ci,按照句子中的两个实体位置划分成三部分{ci1,ci2,ci3},分别为句头到头实体之间的部分,头实体到尾实体之间的部分,尾实体到句尾的部分,并进行分段最大池化操作:

pij=max(cij) (4)

其中,1≤i≤m,1≤j≤3;

每个卷积核fi对应一个3维向量pi={pi1,pi2,pi3};所有卷积核对应向量拼接得到向量通过tanh函数,得到矩阵X最终向量表示:

s=tanh(p1:m) (5)

其中,ds=3m,ds表示矩阵X最终向量表示的维度,此时,句子S对应的向量表示与其长度无关;

对于句子的个矩阵表示通过公式(3)、(4)、(5),得到个对应的特征向量

S4:通过位置特征注意力,得到句子的权重性向量表示:

对于句子通过公式(6),得到其权重性特征向量

其中,αk为的权重,通过公式(7)计算得到:

其中,ek表示向量与句子的对应关系的匹配分数,el表示句子的特征向量集合中第l个向量与句子的对应关系的匹配分数; ek通过公式(8)计算得到:

其中,为句子的对应关系通过Embedding技术得到的嵌入向量;

S5:通过句子注意力,得到包的向量表示;

S6:将数据集的包组合成包对;

S7:获取每一个包对的向量表示;

S8:获取包对的损失值;

S9:通过反向传播和梯度下降,对模型参数进行更新;

S10:根据训练好的模型,针对未标注的包预测该包的关系,获得新的三元组知识,从而挖掘出包中句子的语义信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110453297.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top