[发明专利]基于动态本体的语义和知识图谱分析方法、平台及设备在审
申请号: | 202010131440.6 | 申请日: | 2020-02-28 |
公开(公告)号: | CN113326381A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 王洪波;余江;王亚强;张三海 | 申请(专利权)人: | 拓尔思天行网安信息技术有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/295;G06F40/30 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 本体 语义 知识 图谱 分析 方法 平台 设备 | ||
本申请公开了一种基于动态本体的语义和知识图谱分析方法、平台及设备,该方法包括:获取待处理数据;对所述待处理数据进行文本语义分析和本体化映射处理,抽取本体结构,所述本体结构包括对象、属性和关系;基于所述对象、属性和关系之间的联系,构建知识图谱库,以使得所述对所述待处理数据进行分析处理。该技术方案融合了动态本体知识建模、知识图谱技术和大数据技术等多种技术,实现了对多源异构数据的整合加工,且能够通过文本语义分析和本体化映射处理方法,自动抽取出本体结构,进而构建出知识图谱库,实现了对海量多源异构数据的快速关联挖掘,能够对多源异构数据进行综合分析,提高了数据的使用价值。
技术领域
本发明一般涉及数据处理技术领域,具体涉及一种基于动态本体的语义和知识图谱分析方法、平台及设备。
背景技术
随着互联网技术的快速发展,人工智能已经成为各领域的竞争焦点,各行各业纷纷踏上智能化升级与转型的道路,随之增加了对智能化应用的需求,为了满足人工智能对海量多源异构数据及数据关联挖掘的需要,对大数据进行综合分析尤为重要。
目前,现有技术中对多源异构数据进行分析使用的工具比较传统,且对数据的数据格式要求较高,导致对中文处理支持性差,无法全面地对数据进行综合分析,大大降低了数据的使用价值。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种基于动态本体的语义和知识图谱分析方法、平台、设备和介质,能够通过文本语义分析和本体化映射处理,构建出知识图谱库,从而能够对多源异构数据进行综合分析,很大程度上提高了数据的使用价值,快速实现了从数据到知识的转化。
第一方面,本申请实施例提供了一种基于动态本体的语义和知识图谱分析方法,该方法包括:
获取待处理数据;
对所述待处理数据进行文本语义分析和本体化映射处理,抽取本体结构,所述本体结构包括对象、属性和关系;
基于所述对象、属性和关系之间的联系,构建知识图谱库。
在其中一个实施例中,对所述待处理数据进行文本语义分析处理和本体化映射处理,抽取本体结构,包括:
通过数据知识化处理工具定义本体结构规则;
注册数据库表,所述数据库表用于抽取知识;
基于所述数据库表和所述文本结构规则,得到本体结构。
在其中一个实施例中,基于所述对象、属性和关系之间的联系,构建知识图谱库,包括:
对所述待处理数据进行数据清洗处理,得到处理后的数据;
根据所述本体结构与知识的对应关系,构建核心领域本体库;
基于所述核心领域本体库和所述预处理后的数据,得到知识图谱库。
在其中一个实施例中,对所述待处理数据进行数据清洗处理,得到处理后的数据,包括:
根据数据清洗规则对所述待处理数据进行检测,确定所述待处理数据的类别,所述类别包括正常、已知异常和未知异常;
基于所述待处理数据的类别和所述数据清洗规则,得到处理后的数据。
在其中一个实施例中,,根据所述本体结构与知识的对应关系,构建核心领域本体库,包括:
对获取的知识进行知识整理,提取领域知识;
基于所述领域知识和所述本体结构的映射规则,构建核心领域本体库。
在其中一个实施例中,在构建知识图谱库之后,所述方法还包括:
使用知识图谱平台对所述知识图谱库进行管理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拓尔思天行网安信息技术有限责任公司,未经拓尔思天行网安信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131440.6/2.html,转载请声明来源钻瓜专利网。