[发明专利]一种知识图谱嵌入模型的训练方法、系统和电子设备有效
申请号: | 202011040457.7 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112182245B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 黄庆明;曹宗胜;许倩倩;杨智勇;操晓春 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 嵌入 模型 训练 方法 系统 电子设备 | ||
本发明实施例提供了一种知识图谱嵌入模型的训练方法、系统和电子设备,训练方法包括:A1、用对偶四元数构建知识图谱嵌入模型的嵌入空间,通过对偶四元数将知识图谱中的关系建模为嵌入空间中的旋转和平移;A2、从预设知识图谱中的正样本中进行负采样以生成负样本;A3、对正样本和负样本进行初始化,得到包含以初始嵌入向量表示的正样本和负样本的训练集;A4、利用所述训练集对所述知识图谱嵌入模型进行迭代训练至收敛。本发明构造的新模型可以同时兼具旋转的性能和平移的性能,使得训练得到的知识图谱嵌入模型的嵌入性能得到提升,输出的实体嵌入或者关系嵌入能够更准确地表达预设知识图谱中的实体或者关系。
技术领域
本发明涉及人工智能领域,具体来说涉及知识图谱嵌入技术领域,更具体地说,涉及一种知识图谱嵌入模型的训练方法、系统和电子设备。
背景技术
知识图谱(Knowledge Graph,简称KG)代表实体的相互链接描述的集合,即真实世界的对象、事件、情况或抽象概念。在过去的十年中,知识图谱已被证明是从问题解答、知识推断到自然语言处理等广泛应用的必不可少的组成部分。为了有效地将知识图谱集成到下游人工智能(Artificial Intelligence,简称AI)应用程序中,其中的关键步骤是进行知识图谱嵌入(Knowledge Graph Embedding,简称KGE),知识图谱嵌入的目的是将知识图谱中的实体和关系编码为低维表示形式。
知识图谱嵌入在以下方面有重要作用:
第一、反欺诈方面,知识图谱在反欺诈方面的作用非常大,反欺诈最终目的是识别坏人,把坏人跟其他未知人群的关系找出来,从而认定其他未知人群是否是坏人。先前的普通技术如人为推断等,只能推断一层网络的关系和结构,现在的知识图谱技术则是可以搜索和预测多层的结构和关系,因此效果得到了大大的提升。寻找犯罪嫌疑团伙、不法中介的过程实际上就是要看很大规模的一张网,看很多层关系,关系之间还有强关系、弱关系等。
第二、智能搜索方面,智能搜索的功能类似于知识图谱在谷歌(Google)、百度上的应用。也就是说,对于每一个搜索的关键词,我们可以通过知识图谱来返回更丰富,更全面的信息。
第三、推荐引擎方面,推荐引擎通过知识图谱,查询某节点的消费情况可为其推荐关联度高的可能消费的商品。
第四、精准营销方面,一个聪明的企业可以比它的竞争对手以更为有效的方式去挖掘其潜在的客户。在互联网时代,营销手段多种多样,但不管有多少种方式,都离不开一个核心,即分析和理解用户。知识图谱可以结合多种数据源去分析实体之间的关系,从而对用户的行为有更好的理解。比如一个公司的市场经理用知识图谱来分析用户之间的关系,去发现一个组织的共同喜好,从而可以有针对性的对某一类人群制定营销策略。
从发展历史看,大多数知识图谱嵌入方法根据它们处理关系的方式大致分为两个分支。第一个分支,在本文中称为平移家族(Translation家族),包括TransE模型[1]及其变体。这些方法的共同特点是它们都将关系建模为嵌入空间中头节点到尾节点之间的平移变换。TransE模型是第一个基于“头节点+关系节点=尾节点”原理实现这一假设的模型。然后,TransH模型,TransR模型,TransD模型和TransA模型通过不同的投影策略改进了这种想法。TransG模型、KG2E模型通过分别考虑贝叶斯非参数高斯混合模型和高斯分布协方差,进一步将概率论原理注入该框架。TranSparse模型为传输矩阵提供自适应稀疏性,以寻找知识图谱的异质性和不平衡问题的解决方案。此外,最近一项名为TorusE的工作采用了李群方法从而避免将嵌入空间强制在球面上。总而言之,与以往的复杂模型相比,TransE家族的模型提供了一种简单而有效的方法来获得更好的结果。但遗憾的是,它们无法完全捕获知识图谱中关系的所有四个基本模式,即对称、反对称、反演和组成模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011040457.7/2.html,转载请声明来源钻瓜专利网。