[发明专利]一种基于实体联合嵌入和概率模型的知识图谱补全方法在审
申请号: | 202110502522.1 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113190654A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 竹翠;刘露蔚 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 实体 联合 嵌入 概率 模型 知识 图谱 方法 | ||
1.一种基于实体联合嵌入和概率模型的知识图谱补全方法,其特征在于:该方法包括以下步骤:
步骤1,输入三元组集合,对实体和关系向量进行初始化;
步骤2,利用GCN学习知识图谱作为图结构的特征信息;
步骤3,利用实体的动态嵌入,学习实体在时间维度下动态变化的语义特征;
步骤4,融合步骤2和步骤3的结果,对其做均值运算,对两部分所学的特征进行平均,得到实体的联合嵌入表示;
步骤5,实体的联合嵌入得到实体的向量表示,作为概率模型的输入,通过卷积层和全连接映射输出概率向量对知识图谱进行预测和补全。
2.根据权利要求1所述的一种基于实体联合嵌入和概率模型的知识图谱补全方法,其特征在于:分为三部分:图的结构特征嵌入模块、实体的动态嵌入模块、概率模型用来最后的预测和补全;图的结构特征嵌入模块利用图卷积网络GCN学习知识图谱作为图的拓扑结构和节点特征;具体来讲,利用权重图卷积网络WGCN,将知识图谱抽象成无向图,实体抽象成节点,关系抽象成边;WGCN在聚合过程中积累图的结构信息和其他节点的特征,并且为不同的边类型学习不同的权重参数,从而生成新的节点表示;信息的聚合主要通过聚合函数体现,聚合函数作用于图中每个节点及其邻居节点,通过聚合函数,每个节点表示为邻居特征和自身特征的叠加;实体的动态嵌入模块考虑了时间因素在知识图谱中的重要组成,将三元组发生的时间融入实体的建模中;具体来讲将实体的特征维度分为静态特征和时间特征,静态部分保留不变的特征,时间部分随着时间而变化;概率模型利用神经网络这种深层次网络架构对关系建模并且输出预测;具体来讲将实体向量和关系向量拼接成矩阵送入概率模型,在矩阵上进行卷积操作,得到一系列特征图,将特征图拼接成长向量,通过全连接映射到和实体特征同维度的大小,再和实体嵌入矩阵相乘,输出实体大小维度的概率向量。
3.根据权利要求1所述的一种基于实体联合嵌入和概率模型的知识图谱补全方法,其特征在于:整个模型的优化目标为最小化一个二元交叉熵损失函数,|ε|为实体大小,pi为模型最终输出的概率向量中的第i个分量,0≤i≤|ε|-1;对于损失函数来说,算法需要构造尾实体的真实标签向量并且使用预测的概率向量去拟合真实的标签向量;真实标签向量T的每一项分量定义如下所示,ti∈I,当给定头实体h和关系r时,I为有效的尾实体集合,为真实三元组集合;此时标签向量T作为one-hot向量,分量值为0代表零概率,1代表全概率,这种情况使得模型缺乏适应性,过于自信;通过平滑标签机制在真实分布中增加部分噪声,避免造成过度拟合,增强模型的泛化能力;表示标签平滑后的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110502522.1/1.html,转载请声明来源钻瓜专利网。