[发明专利]基于无监督类型约束的上下文感知知识补全方法及系统在审
申请号: | 202111158961.1 | 申请日: | 2021-09-30 |
公开(公告)号: | CN114020923A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 汪璟玢;赖晓连 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 张灯灿;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 类型 约束 上下文 感知 知识 方法 系统 | ||
本发明涉及一种基于无监督类型约束的上下文感知知识补全方法及系统,该方法构建基于无监督类型约束的上下文感知模型,首先,通过设定时间粒度,对数据集预处理,以使数据在时间分布上均衡;其次,在四元组结构模块中,通过邻居编码器聚合实体上下文信息,增强实体的嵌入表示;在四元组类型模块中,将四元组嵌入到实数空间,四元组类型模块在无监督环境下获得类型约束的实体表示,通过实体潜在类型信息进一步约束实体嵌入表示,提高模型补全能力;最后,将四元组结构模块的得分与四元组类型模块的得分按照设定的权重聚合,获得四元组的最终得分。该方法及系统提高了实体嵌入的质量,提升了模型在知识补全任务上的性能。
技术领域
本发明属于知识图谱领域,具体涉及一种基于无监督类型约束的上下文感知知识补 全方法及系统。
背景技术
知识表示学习是一种有效且可靠的知识补全技术,这几年来,有关知识图谱的表示 学习方法层出不穷。ComplEx将三元组嵌入到复数空间中,能够建模对称/反对称、自 反两种关系模型,在静态知识图谱补全任务上取得了一定的成效。AutoETER将四元组 嵌入到实数空间中,自动学习实体的类型嵌入,丰富了实体的一般特征,此外,它还可 以推断和建模所有对称/反对称、自反和组合三种关系模式,以及复杂的一对多、多对一 和多对多关系。CompGCN利用GCN聚合实体的邻居信息,增强了实体的嵌入表示, 该模型还通过设置基向量解决了过度参数化的问题。上述模型都建立在静态知识图谱上, 在静态知识图谱补全任务上表现良好,但由于没有考虑时间信息,在时间知识图谱补全 任务上性能不佳。
近年来,许多工作努力将静态知识图谱补全模型扩展到时间知识图谱中。比如,HyTE为每个时间戳定义了一个时间超平面,并将实体和关系投影到时间超平面中,然 后对投影的嵌入应用TransE以获得四元组的得分。等人将时间戳划 分为token序列,与关系一并输入到LSTM中,以获得不同时间下的关系表示,获得的 关系表示可以应用于多个模型中,Jain等人将该方法应用于ComplEx中,得到了 TA-ComplEx模型。受历时词的启发,Goel等人将时间信息整合到实体嵌入中,提出了 DE-SimplE模型。DE-SimplE认为实体嵌入中可能有一些随时间变化的特性和一些保持 固定的特性,因此设置了用以控制时间特征百分比的超参数γ∈[0,1],在时间知识图谱 补全任务中取得了显著的效果。TeRo将实体嵌入的时间演化定义为实体在复数空间中 从初始时间到当前时间的旋转,模型结合了RotatE的优势,可以建模实体间的复杂关系 (如自反关系)。此外,TeRo采用时间粒度合并部分时间戳,可以缓解数据集在时间 上分布不均衡问题。受四阶张量分解启发,Lacroix等人将四元组嵌入到复数空间中, 提出了TNT-ComplEx模型,该模型通过四元组的内积操作得到四元组的得分,得分函 数定义为Jain等人提出的TIMEPLEX根据时间的特有性质,定 义了三种类型的时间约束:关系的重复性、关系间的顺序、关系间的时间间隔。其中, 关系的重复性即许多关系对于特定实体不会重复出现(例如,一个人只出生一次),有 些关系在固定周期内重复(例如,奥运会每四年出现一次)。关系间的顺序是指对于一 个给定的实体,一个关系先于另一个关系。比如,PersonBornYear应在给定实体的 PersonDiedYear之前。关系间的时间间隔是指对于一个给定的实体,两个关系间的时间 差值分布在一个平均值周围,例如,PersonDiedYear减去PersonBornYear的平均值约为 70。TIMEPLEX在没有额外时间约束输入的情况下,使用高斯分布建模这三种时间约束, 在时间知识图谱补全任务中表现出了良好的性能。上述时间知识图谱补全模型,虽然在 时间知识图谱补全任务中取得了一定的成效,但都忽略了实体隐含的潜在信息,如类型 信息和邻居信息,在时间知识图谱补全任务中具有一定的局限性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111158961.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:板状晶碳化钨粉及其制备方法和硬质合金
- 下一篇:一种混动车用功率模块