[发明专利]一种基于周围信息的知识图谱嵌入及回复生成方法在审

专利信息
申请号: 202210621120.8 申请日: 2022-06-02
公开(公告)号: CN115062587A 公开(公告)日: 2022-09-16
发明(设计)人: 荣文戈;胡元昊;白骏;欧阳元新;熊璋 申请(专利权)人: 北京航空航天大学
主分类号: G06F40/126 分类号: G06F40/126;G06N3/04;G06N3/08
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 安丽;顾炜
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 周围 信息 知识 图谱 嵌入 回复 生成 方法
【权利要求书】:

1.一种基于周围信息的知识图谱嵌入生成方法,其特征在于,包括以下步骤:

步骤1:提取知识图谱中的头节点周围三元组N(h),使用非对称周围信息编码机制对N(h)进行编码,得到头节点周围三元组的编码;

具体步骤如下:

(11)提取头节点周围三元组,N(h)={(hn,rn)|(hn,rn,h)∈G}∪{(tn,r′n)|(h,rn,tn)∈G}表示头节点h的周围三元组情况,其中r′n是为了保证周围三元组的时序关系而基于周围三元组关系节点rn新建立的关系节点,与周围三元组关系节点rn对应;G表示知识图谱的三元组集合,hn表示周围三元组头节点;n表示周围三元组序号;

(12)非对称周围信息编码机制包括LSTM序列编码和线性门控机制;

LSTM序列编码的两个时间步的输入分别为嵌入hi和ri,头节点h的嵌入作为LSTM结构的初始细胞状态和隐藏状态参与计算,LSTM序列编码的输出为第二个LSTM时间步的细胞状态和隐藏状态cell2和hidd2

cell2,hidd2=LSTM(h,hi,ri)

随后使用线性门控机制对于LSTM序列编码的输出cell2和hidd2作进一步的处理,将cell2和hidd2拼接,然后使用基于Sigmoid门控机制分别确定对于cell2和hidd2需要保留的信息c′1和h′1以及对于cell2和hidd2需要更新的信息u1,再将得到的向量c′1,h′1和u1进行拼接;并使用线性层将拼接后的三个向量c′1,h′1和u1映射到知识图谱嵌入所在的维度,Wupdate,bupdate,均为可以学习的线性层参数,线性门控机制映射和拼接的计算公式如下:

其中:

x′update=tanh(Wupdate·[cell2,hidd2]+bupdate)

得到头节点周围三元组的编码ei,其中W和b是可以学习的线性参数:

e1=relu(W·[h′1;c′1;u1]+b)+hidd2+cell2

头节点周围三元组编码ei所组成的集合记为N′(h),即头节点周围三元组编码集合;

然后在头节点周围三元组编码集合N′(h)中添加零向量,通过非对称周围信息编码机制保留周围三元组的序列关系;

步骤2、基于步骤1中得到的头节点周围三元组编码集合N′(h),采用线性门控机制对N′(h)进行降维,得到降维后的头节点周围信息

步骤3、采用线性权重注意力机制将三元组中头节点嵌入和降维后的头节点周围信息进行整合,获得引入周围信息的头节点表示hcontext

步骤4、采用门控注意力机制将三元组中的关系节点与邻居头节点进行整合,计算得到关系节点周围头节点整合信息使用门控注意力机制将关系节点与邻居尾节点进行整合,计算得到关系节点周围尾节点整合信息将和进行聚合,得到引入周围信息的关系节点表示rcontext

步骤5、使用基于卷积操作和残差网络的主编码结构,对步骤3算得的引入了周围信息的头节点表示hcontext和步骤4算得的引入了周围信息的关系节点rcontext表示进行编码,得到对于尾节点嵌入t的编码拟合t′;

所述基于卷积操作和残差网络的主编码结构的实现过程具体如下:

(51)将引入周围信息的头节点表示hcontext和引入周围信息的关系节点rcontext分别扩展至二维,得到h′context和r′context,再对h′context和r′context进行上下拼接,得到张量[h′context||r′context];

(52)采用并行处理的方式使用多个卷积结构分别对张量[h′context||r′context]进行处理,即分别使用4个核函数尺寸分别为(1×1),(3×3),(5×5),(5×5)的卷积结构对于[h′context||r′context]进行处理得到A1-A4,每个卷积结构包含的核函数数量均是32;

A1=W1*[h′context||r′context]

A2=W2*[h′context||r′context]

A3=W3*[h′context||r′context]

A4=W4*[h′context||r′context]

符号*表示卷积化操作,W1、W2、W3、W4表示具有不同核函数尺寸的卷积参数,经过不同卷积结构得出的信息为A1,A2,A3和A4

(53)将编码输入信息[h′context||r′context]沿着所在的第三个维度重复多次得到A0,保证A0和其他经过处理卷积层处理过后的张量Ai等维度相同;采用残差神经网络将其他经过处理过后的张量信息Ai与未经处理的输入A0进行整合,得到张量A;

再对张量A进行拉平操作,并使用线性层将张量A映射到知识图谱嵌入所在的维度,得到对于尾节点嵌入的编码拟合t′,

t′=relu(Wmain(Flatten(A))+bmain)

将基于卷积操作和残差网络的主结构编码方法记为:main_encoder,即:t′=main_encoder(hcontext,rcontext);bmain是线性层的偏置量,Wmain是线性转换矩阵;

步骤6:将t′与尾节点嵌入t的点积作为最终的得分函数,定义损失函数并进行训练,得到最终的知识图谱嵌入表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210621120.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top