[发明专利]基于实体序列编码的知识图谱融合方法有效
| 申请号: | 201911393679.4 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111191471B | 公开(公告)日: | 2022-06-28 |
| 发明(设计)人: | 李建欣;黄洪仁;宁元星;毛乾任;司靖辉 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/295;G06F16/36 |
| 代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 实体 序列 编码 知识 图谱 融合 方法 | ||
1.一种基于实体序列编码的知识图谱融合方法,其特征在于,所示方法包括:
步骤一:知识图谱实体表示学习;
步骤二:选择路径编码和对齐模型;
步骤三:跨语言实体对齐模型,其中,在源语言知识图谱空间中,针对其中的一个实体,构建与其他种子实体的2跳序列,在目标语言知识图谱空间中构建可能与之对应的序列,找出概率最高的对齐序列,然后从对齐序列中找到同位置的节点,作为该节点的对齐节点;
步骤四:添加新的候选种子节点;
所述步骤一中,使用RotatE模型分别学习两源语言知识图谱空间和目标语言知识图谱空间中的实体表示向量和关系表示向量,所述RotatE模型通过三种关系:对称、反转、构成,来训练所述实体表示向量和所述关系表示向量,得到三元组集合和种子实体对;
所述步骤二中,包括构建训练实体序列、对实体序列进行编码;对于任意一对跨语言对齐种子实体,在所述源语言知识图谱空间中选择2跳路径,所述2跳路径上的点都是对齐的种子实体,构建长度为5的节点序列,在所述目标语言知识图谱空间中构建同样长度为5的节点序列,两个空间中2跳实体序列上的点是一一对应的;训练时,对所述节点序列上的节点和关系的表示向量进行拼接和卷积操作学习出2个实体序列的表示,并设计公式计算两个实体序列是否是同一实体序列的概率;
所述计算两个实体序列是否是同一实体序列的概率的公式为:
p(vt|vs)=exp(-η||vt-θvs||2)。
2.根据权利要求1所述的基于实体序列编码的知识图谱融合方法,其特征在于,
所述步骤四中,待步骤三得到所述节点后,如果与旧的训练语料没有冲突,生成新的实体表示路径,作为新的训练语料训练对齐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393679.4/1.html,转载请声明来源钻瓜专利网。





