[发明专利]基于领域知识的图编码自动生成方法及系统、电子设备有效
申请号: | 202011590695.5 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112287043B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 姚苗;查琳;冶莎;张晨;周智海;王芳杰;覃晨;黄庆娇;王振宇;陈刚;何青松;向波;杨志勤;邢尚合;周凡吟 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/26;G06F16/36;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京市领专知识产权代理有限公司 11590 | 代理人: | 张玲;王莹莹 |
地址: | 610015 四川省成都市自由贸易试*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 领域 知识 编码 自动 生成 方法 系统 电子设备 | ||
本发明涉及一种基于领域知识的图编码自动生成方法及系统、电子设备,其中该方法包括步骤:对收集的业务数据进行预处理,得到由实体、关系、属性构成的三元组列表,并由三元组列表得到第一邻接矩阵和第一特征矩阵;将所述第一邻接矩阵、第一特征矩阵和设定的微调参数列表,输入预训练好的通用型图编码模型进行自动训练,得到所述业务数据的图编码矩阵;所述通用型图编码模型基于领域知识训练而得。本发明通过先基于领域大数据训练得到通用型图编码模型,当有新的业务数据时,再基于通用型图编码模型进行参数调整,即可得到适应该业务数据的图编码矩阵,不仅可以极大地提升图编码效率,而且得到的图编码矩阵具有更丰富的语义,解决语义稀疏问题。
技术领域
本发明涉及知识图谱技术领域,特别涉及一种基于领域知识的图编码自动生成方法及系统、电子设备。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。图编码是图计算、图分析、图挖掘的前置步骤。目前,在工程应用领域,图编码的构建都是基于当前业务数据进行,这意味着每当业务数据发生变化时,都需要重新建立图编码模型,进行模型的训练、模型的验证、模型的测试,才能得到适应新业务数据的图编码模型,也就是每次有任务需求都需要根据该业务数据进行图编码建模,效率极其低下,无法快速地、敏捷地响应业务场景中,基于图数据进行信息挖掘、信息预测等要求。另外,图编码仅基于当前业务数据进行构建,也存在图编码语义稀疏性问题,导致基于图表面的图计算可能不够准确。
发明内容
本发明的目的在于改善现有技术中所存在的图编码效率低下、语义稀疏的不足,提供一种基于领域知识的图编码自动生成方法及系统、电子设备,以提升图编码的效率,并丰富图编码的语义信息。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
一方面,本发明实施例提供了一种基于领域知识的图编码自动生成方法,包括步骤:
对收集的业务数据进行预处理,得到由实体、关系、属性构成的三元组列表,并由三元组列表得到第一邻接矩阵和第一特征矩阵;
将所述第一邻接矩阵、第一特征矩阵和设定的微调参数列表,输入预训练好的通用型图编码模型进行自动训练,得到所述业务数据的图编码矩阵;所述通用型图编码模型基于领域知识训练而得。
上述方案中,收集到新业务数据后,并不是像传统方法那样基于该新业务数据重新训练得到对应的图编码矩阵,而是将该业务数据预处理后输入已经训练好的通用型图编码模型,在该通用型图编码模型的基础上进行参数微调,即可快速得到图编码矩阵,参数微调与重新训练、验证相比,可以极大地节省时间,因此本方法可以大大提升图编码的处理效率。另外,由于通用型图编码模型是基于领域内大数据训练得到的,相比于仅基于单一应用的业务数据,数据更全面,可获得的语义更丰富,因此可以解决目前图编码存在的语义稀疏问题。
所述对收集的业务数据进行预处理,得到由实体、关系、属性构成的三元组列表的步骤,包括:基于领域的数据标准,将收集的业务数据处理为标准化数据;对所述标准化数据进行实体抽取、属性抽取、关系抽取,并建立实体,关系,实体的三元组列表和实体,关系,属性的三元组列表。
上述方案中,先将数据进行标准化处理,然后再提取实体、关系、属性,建立三元组列表,标准化处理后方便于快速提取所需信息,因此本方案可以提升信息提取效率,同时也能保障信息提取准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011590695.5/2.html,转载请声明来源钻瓜专利网。