[发明专利]一种基于架构的知识库构建方法在审
申请号: | 202110069435.1 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112766506A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 任南琪;王爱杰;王旭;路璐;冯骁驰 | 申请(专利权)人: | 澜途集思生态科技集团有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06F16/35;G06Q50/26 |
代理公司: | 北京市京师律师事务所 11665 | 代理人: | 高晓丽 |
地址: | 100000 北京市海淀区蓝靛*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 架构 知识库 构建 方法 | ||
1.一种基于架构的知识库构建方法,其特征在于,包括如下操作步骤:
S1构建水域环境领域的基础数据库;
S2获取水域污染的文本数据;
S3采用类机器学习方法从水域污染文本数据中提取结构化污染数据;
S4按照预设分类对结构化污染数据进行分类处理,确定多个污染类别,根据多个污染类别、污染场景和污染内容,确定多个污染知识的标签,得到污染分类处理结果;
S5采用数据分析算法对结构化污染数据进行挖掘分析,得到污染挖掘分析结果;
S6整合与自然灾害和人为因素的相关监测系统,从监测系统中提取自然灾害和人为因素的监测数据;
S7基于污染文本数据、结构化污染数据、污染分类处理结构、污染挖掘分析结果和基础数据库进行扩展,将多个污染知识的标签,存入数据库中,形成水域环境领域知识库。
2.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述步骤S1构建水域环境领域的基础数据库包括:采集历史污染案例,根据历史案例生成事件对象,事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介,将事件对象存储为基础数据库。
3.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述步骤S4中还包括修改指令,修改指令为确定修改后的标签,在知识库中,将指定修改后的标签替换原有标签。
4.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述构建水域环境领域的基础数据库包括获取审核信息和审核需求,其中,审核需求对应多个审核领域,按照预设的分组规则对所述审核信息进行分组,生成多个审核数据组,根据多个审核数据组构建不同领域的基础数据库。
5.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述步骤S3结构化污染数据获取包括:对污染数据进行知识处理,获得候选数据,对候选数据进行知识融合,获得结构化数据。
6.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述步骤S2文本数据获取包括:确定预设污染关键字;采用分布式爬虫技术和/或增量式爬虫技术从目标网站中获取与预设污染关键字相匹配的原始文本数据,对原始文本数据进行预处理,得到污染文本数据。
7.根据权利要求6所述的一种基于架构的知识库构建方法,其特征在于,所述原始文本数据预处理包括:进行文本内容抽取、数据清洗和去重、翻译、语义识别以及词性识别,得到污染文本数据。
8.根据权利要求1所述的一种基于架构的知识库构建方法,其特征在于,所述污染文本数据、结构化污染数据、污染分类处理结构、污染挖掘分析结果和基础数据库存入私有云数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于澜途集思生态科技集团有限公司,未经澜途集思生态科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110069435.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水陆两用救援担架
- 下一篇:用于自行车的悬架部件