[发明专利]一种基于组合结构的规范知识存储方法在审

专利信息
申请号: 202010565742.4 申请日: 2020-06-19
公开(公告)号: CN111915010A 公开(公告)日: 2020-11-10
发明(设计)人: 黑新宏;杨明松;李宇超;赵钦;贾博;王媞霖;朱磊 申请(专利权)人: 西安理工大学
主分类号: G06N5/02 分类号: G06N5/02;G06F16/901;G06F16/28;G06F16/25;G06F16/22;G06F16/31
代理公司: 西安弘理专利事务所 61214 代理人: 王丹
地址: 710048 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 组合 结构 规范 知识 存储 方法
【说明书】:

发明公开了一种基于组合结构的规范知识存储方法,包括构建规范基本信息抽取表、规范文本信息抽取表和规范语义信息抽取表,从规范非具体条文部分的版面中识别并抽取规范知识,完成规范基本信息抽取表的填写;从规范正文中识别并抽取规范文本信息抽取表中所需的信息,完成规范文本信息抽取表的填写;从规范文本中得到符号化的可计算语义信息,分析并抽取规范语义信息抽取表所需信息,完成规范语义信息抽取表的填写;使用图数据库和关系数据库对规范基本信息抽取表、规范文本信息抽取表和规范语义信息抽取表中信息进行存储。采用本发明规范知识存储方法能够用于构建大规模规范领域知识库,覆盖面广。

技术领域

本发明属于知识工程中的知识智能存储技术领域,涉及一种基于组合结构的规范知识存储方法。

背景技术

人工智能为新时代的高质量发展赋能,各传统行业都在数据化、信息化、自动化、智能化的赛道上加速发展。建设提速增量的同时,也应确保精准化设计、精益化施工、智能化管控。

行业规范作为设计、施工以及运维管控时的执行依据和知识抽象,针对各个阶段的操作过程以及产出成果提出了具体的约束要求和解释说明。构建规范领域知识库是促进建筑行业智能化发展的基础工作。同时领域知识的集成和管理也是人工智能在解决感知问题后向认知智能转变时面临的一大挑战,构建领域大规模知识库并基于知识进行推理和应用是现阶段领域人工智能的研究重点之一。

规范知识库的构建分为规范知识表示和规范知识存储两个大的部分。规范表示的方法多种多样,但是存储方法却大同小异。现有的规范知识存储方法分为三类:1)通过对规范知识硬编码,采用内置规则集的形式,实现存储。该方法将知识表示与知识存储绑定在一起,导致了规范知识的使用灵活度差、且难以更新维护等缺点;2)基于语义标记文件的形式进行存储,如 XML文件、RDF文件或HTML文件等。基于标记文件的存储方法大多是针对少量的数据(如:某本规范中具体的某一章节),该方法用于海量的规范知识时需要借助关系数据库等数据管理系统进行优化。3)使用关系数据库进行存储。考虑到规范知识结构的高相关性和高复杂性,在关系结构存储模型中需要建立大量的数据表来进行知识存储,除了数据表设计难度高之外,大部分的表结构层级复杂且数据稀疏。该方法在进行基于知识的查询时,涉及多表联查,需要使用大量join操作,并且SQL优化难度高,查询效率低下。除上述问题之外,现有的规范知识存储模型仅关注蕴含在具体条文中的知识,忽略了蕴含在规范体系分类模式中和非具体条文部分的版面中所包含的领域知识,存在知识缺失问题。

发明内容

本发明的目的是提供一种基于组合结构的规范知识存储方法,解决了现有规范知识存储方法覆盖面不全,对大批量关联数据存储难度大的问题。

本发明所采用的技术方案是,一种基于组合结构的规范知识存储方法,包括建立规范基本信息抽取表、规范文本信息抽取表和规范语义信息抽取表,从规范非具体条文部分的版面中识别并抽取规范知识,完成规范基本信息抽取表的填写;从规范正文中识别并抽取规范文本信息抽取表中所需的信息,完成规范文本信息抽取表的填写;从规范文本中得到符号化的可计算语义信息,分析并抽取规范语义信息抽取表所需信息,完成规范语义信息抽取表的填写;使用图数据库和关系数据库对规范基本信息抽取表、规范文本信息抽取表和规范语义信息抽取表中信息进行存储。

本发明的技术特征还在于,

具体包括以下步骤:

步骤1,建立规范基本信息抽取表;

步骤2,从规范非具体条文部分的版面中识别并抽取所包含的规范知识,使用步骤1中建立的规范基本信息抽取表进行记录;

步骤3,建立规范文本信息抽取表;

步骤4,从规范正文中识别并抽取规范文本信息抽取表中所需的信息,完成规范文本信息抽取表的填写;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010565742.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top