[发明专利]用于生成节点的向量表示的方法和装置有效
申请号: | 202010006902.1 | 申请日: | 2020-01-03 |
公开(公告)号: | CN111241095B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 秦华鹏;赵岷;程健一 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 节点 向量 表示 方法 装置 | ||
本申请实施例公开了用于生成节点的向量表示的方法和装置,涉及计算机技术、知识图谱领域。该方法的一具体实施方式包括:获取树结构中的节点的标识和相似节点集合,其中,节点是知识图谱中的实体;构造向量化模型,其中,向量化模型的参数是节点的初始向量表示;将节点的标识作为输入,将节点的相似节点集合作为输出,通过迭代更新节点的初始向量表示对向量化模型进行训练,直至向量化模型收敛,得到节点的向量表示。该实施方式利用节点的相似节点集合训练以节点的初始向量表示为参数的向量化模型,得到节点的向量表示,能够将树结构嵌入到向量空间,捕捉到可传递的节点相似关系。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于生成节点的向量表示的方法和装置。
背景技术
知识图谱中,树结构是描述集合或可传递层次关系的一种常用数据结构,常被用来表征知识的上下位关系,如概念体系结构、百科的类别结构、知网、概念网等知识图谱数据。
目前,常用的知识图谱嵌入到向量空间的方法主要包括以下三种:其一,基于图结构中的路径信息,使用有偏随机游走采样,将图结构嵌入到向量空间中,训练得到节点的向量表示;其二,利用图注意力机制学习图中的节点及边关系,训练得到知识图谱中节点及边关系的向量表示;其三,基于三元组关系学习图中节点及边关系,训练得到节点的向量表示。然而,上述三种方法均无法捕捉到可传递的语义相似关系,不适用于树结构知识图谱。
发明内容
本申请实施例提出了用于生成节点的向量表示的方法和装置。
第一方面,本申请实施例提出了一种用于生成节点的向量表示的方法,包括:获取树结构中的节点的标识和相似节点集合,其中,节点是知识图谱中的实体;构造向量化模型,其中,向量化模型的参数是节点的初始向量表示;将节点的标识作为输入,将节点的相似节点集合作为输出,通过迭代更新节点的初始向量表示对向量化模型进行训练,直至向量化模型收敛,得到节点的向量表示。
在一些实施例中,获取树结构中的节点的相似节点集合,包括:基于节点在树结构上单向遍历,得到节点的相似节点集合。
在一些实施例中,基于节点在树结构上单向遍历,得到节点的相似节点集合,包括:基于节点在树结构上向下采样或向上采样,得到节点的相似节点集合,其中,向下采样的相似度偏序为:{后代节点}{父节点}{父节点的其他后代节点}{祖先节点}{祖先节点的其他后代节点},向上采样的相似度偏序为:{父节点、子节点、兄弟节点}{祖先节点、后代节点}{祖先节点的其他节点}。
在一些实施例中,基于节点在树结构上向下采样,得到节点的相似节点集合,包括:基于节点在树结构上向下采样到节点的后代节点;确定节点的后代节点的数目是否小于最小相似节点数目阈值;若不小于最小相似节点数目阈值,基于节点的后代节点生成节点的相似节点集合;若小于最小相似节点数目阈值,按照向下采样的相似度偏序继续在树结构上采样,直至所采样到的节点的数目不小于最小相似节点数目阈值,基于所采样到的节点生成节点的相似节点集合。
在一些实施例中,基于节点在树结构上向上采样,得到节点的相似节点集合,包括:基于节点在树结构上向上采样到节点的父节点、子节点和兄弟节点;确定节点的父节点、子节点和兄弟节点的总数目是否小于最小相似节点数目阈值;若不小于最小相似节点数目阈值,基于节点的父节点、子节点和兄弟节点生成节点的相似节点集合;若小于最小相似节点数目阈值,按照向上采样的相似度偏序继续在树结构上采样,直至所采样到的节点的数目不小于最小相似节点数目阈值,基于所采样到的节点生成节点的相似节点集合。
在一些实施例中,向量化模型以下一项:跳字模型、卷积神经网络和连续词袋模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010006902.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种代码生成方法及装置
- 下一篇:任务推荐的方法及装置