[发明专利]面向张量分解型知识图谱补全的正则项确定方法及装置在审
申请号: | 202011215923.0 | 申请日: | 2020-11-04 |
公开(公告)号: | CN112784055A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 王杰;张占秋;蔡健宇 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李婷婷 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 张量 分解 知识 图谱 正则 确定 方法 装置 | ||
本实施例公开了一种面向张量分解型知识图谱补全的正则项确定方法及装置,方法包括:确定原始模型,原始模型为基于张量分解模型的打分函数;确定与原始模型对应的对偶模型,对偶模型为基于距离的模型打分函数;确定原始模型和对偶模型之间的对偶性;基于对偶性确定原始模型对应的第一正则项。确定了第一正则项后,后续可将其应用于面向张量分解型知识图谱补全,从而在保持基于张量分解的知识图谱补全模型表达性的同时,防止出现过拟合问题;同时该实现方案可以广泛应用于各种基于张量分解的模型,适用范围更广。
技术领域
本发明涉及自然语言处理技术,更具体的说,是涉及一种面向张量分解型知识图谱补全的正则项确定方法及装置。
背景技术
知识图谱由大量的事实三元组构成,其存储了结构化的人类知识。近年来,知识图谱在诸如自然语言处理、智能问答、推荐系统和计算机视觉等领域取得了巨大的成就。
常用的知识图谱通常包含数十亿个三元组,但其中仍会存在大量的三元组缺失。因知识图谱的规模极为庞大,人工对图谱进行补全代价高昂。因此,基于知识图谱中的已知三元组来自动预测缺失三元组的知识图谱补全技术近年来备受关注。
知识图谱补全模型有两大类:基于距离的模型和基于张量分解的模型。基于距离的模型使用闵可夫斯基距离来度量三元组的合理性,虽然这类模型可以达到目前的最佳性能,但在建模复杂的关系模式(如一对多和多对一关系)时仍然存在困难。基于张量分解的模型将知识图谱视为部分可观测的三阶张量,从而将知识图谱补全建模为一个张量补全问题;从理论上讲,这些模型表现力强,能够很好地处理复杂的关系,然而它们往往面临严重的过拟合问题,无法达到最佳性能。
为了解决基于张量分解模型的过拟合问题,研究人员提出了各种正则化方法,然而目前并不存在理想的既高效又适用广泛的正则化方法。
发明内容
有鉴于此,本发明提供如下技术方案:
一种面向张量分解型知识图谱补全的正则项确定方法,包括:
确定原始模型,所述原始模型为基于张量分解模型的打分函数;
确定与所述原始模型对应的对偶模型,所述对偶模型为基于距离的模型打分函数;
确定所述原始模型和所述对偶模型之间的对偶性;
基于所述对偶性确定所述原始模型对应的第一正则项。
可选的,还包括:
确定所述原始模型的变形表示模型;
基于所述对偶性确定所述变形表示模型对应的第二正则项。
可选的,还包括:
将所述第一正则项和所述第二正则项相加,并将相加的结果作为所述原始模型的最终正则项。
可选的,所述确定所述原始模型和所述对偶模型之间的对偶性,包括:
通过展开所述对偶模型确定所述原始模型和所述对偶模型之间的对偶性。
可选的,所述确定与所述原始模型对应的对偶模型,包括:
确定原始模型为
通过线性变换对实体嵌入hi做一个映射,使用内积的实部来度量和tk之间的内积相似性;
采用欧几里德距离代替上述原始模型公式中的内积相似性,得到与所述原始模型对应的对偶模型。
一种面向张量分解型知识图谱补全的正则项确定装置,包括:
原始模型确定模块,用于确定原始模型,所述原始模型为基于张量分解模型的打分函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011215923.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于蓄电装置的冷却系统
- 下一篇:同轴齿轮装置