[发明专利]一种日志数据的知识图谱构建方法有效
| 申请号: | 202011444358.5 | 申请日: | 2020-12-08 |
| 公开(公告)号: | CN112579707B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 李晓戈;邱连涛;胡飞雄;胡立坤;于智洋;张东 | 申请(专利权)人: | 西安邮电大学;腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/26;G06F16/215;G06F40/186;G06N20/00 |
| 代理公司: | 北京易捷胜知识产权代理有限公司 11613 | 代理人: | 齐胜杰;李会娟 |
| 地址: | 710121 陕西省*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 日志 数据 知识 图谱 构建 方法 | ||
本发明公开了一种日志数据的知识图谱构建方法,包括:S1、获取指定时间窗口内的日志数据;S2、对所述日志数据进行预处理,并转换为结构化的日志数据;以及依据模板树建立策略建立模板树;S3、基于建立的模板树,获取日志模板;S4、基于结构化的日志数据和日志模板,进行实体抽取和关系抽取,获得用于输出的多个三元组数据,所述三元组数据为实体-关系-实体形式的数据;S5、对多个三元组数据按照时间序列进行融合,获得日志数据的知识图谱。本发明的方法能够将非结构化文本数据转化为结构化数据,构建运维日志知识图谱,围绕着知识图谱中的实体信息,从不同纬度为业务的实体信息提供不同功能的可视化服务。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种日志数据的知识图谱构建方法。
背景技术
随着互联网的普及,数据量的飞速增长使得信息越来越多,人们对信息查询的质量和精准度要求越来越高。日志系统对运维工作而言是一个非常重要的组成部分,它记录系统与操作者产生的所有行为,并且同时按照开发人员的某一种规范对其操作进行记录。
然而,现有技术中对于异常的运维数据,智能通过人工去查看,并不能自动查看,同时无法查看其关联的可能发生异常的运维数据,为此,如何建立一种知识图谱去实现表示运维数据的实体及运维数据的关系成为当前需要解决的技术问题。
发明内容
(一)要解决的技术问题
鉴于现有技术的上述缺点、不足,本发明提供一种日志数据的知识图谱构建方法,能够更好地通过挖掘有用信息从而形成知识图谱,并进一步可实现结果可视化。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
根据本发明的一个方面,提供了一种日志数据的知识图谱构建方法,包括:
S1、获取指定时间窗口内的日志数据;
S2、对所述日志数据进行预处理,并依据模板树建立策略建立模板树;
S3、基于建立的模板树,获取日志模板;
S4、基于获取的日志数据和日志模板,进行实体抽取和关系抽取,获得用于输出的多个三元组数据,所述三元组数据为实体-关系-实体形式的数据;
S5、对多个三元组数据按照时间序列进行融合,获得日志数据的知识图谱。
可选地,所述S5包括:
将三元组数据存放在图数据库中,将与三元组数据对应的时间序列的信息存储在时序数据库中,用以在可视化显示时按照时间序列调用三元组数据,以获得日志数据的知识图谱;
所述图数据库为Neo4j型标准化数据库,所述时序数据库为OpenTSDB型标准化数据库;
或者,
将三元组数据中不同的实体类型及属性使用Cypher语句导入图数据库,使用OpenTSDB服务将实体关系及属性存储在时序数据库中;
所述图数据库为Neo4j型标准化数据库,所述时序数据库为OpenTSDB型标准化数据库。
可选地,所述方法还包括:
S6、接收平台输入的请求信息,依据请求信息中的可视化服务信息,向用户展示与可视化服务信息对应的实体关系;
或者,使用D3.js中的力导向图完成实体关系的可视化,或者,使用D3.js中的EventDrops进行实体时序的可视化。
可选地,所述S2包括:
S2-1、对每一条日志数据,将日志数据中正文内容对应的非结构化的数据转化为结构化的正文数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学;腾讯科技(深圳)有限公司,未经西安邮电大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011444358.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





