[发明专利]一种知识驱动的企业信息管理方法、系统及存储介质在审
申请号: | 202110534125.2 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113204960A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 王铁鑫;孙进宇;李成 | 申请(专利权)人: | 南京德奈特系统科技有限责任公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/253;G06F40/289;G06F40/30;G06F16/36;G06F16/25 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 房小颖 |
地址: | 211100 江苏省南京市江宁区麒麟*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 驱动 企业 信息管理 方法 系统 存储 介质 | ||
本发明公开了一种知识驱动的企业信息管理方法、系统及存储介质,涉及人工智能技术领域;其中构建领域知识本体包含以下步骤:从数据源中抽取待分析数据;确定本体的领域和范围,构建数据字典;从待分析数据中抽取层次关系与非层次关系;对数据属性增加约束函数;从数据库中导入数据,创建个体;建立推理规则,进行知识推理,发掘并补全数据间关联。面向高新技术园区的企业管理需求,本发明通过构建的领域本体,实现园区内企业信息的快速查询、企业上报数据纠错、园区内企业关系建立,面向企业的精准招商与研判,并对园区内企业的发展前景进行预测;本发明可有效提高高新技术园区内企业管理效率,同时对园区内部分企业进行过滤。
技术领域
本发明属于信息管理的技术领域,特别是涉及一种知识驱动的企业信息管理方法、系统及存储介质。
背景技术
随着人工智能技术和机器认知智能的飞速发展,高新技术产业园区对企业数据的管理需求由传统的存储需求上升为智能分析需求,对企业信息数据的查询速度、数据信息关联度、企业数据信息解读有了更高层次的要求。
在传统的数据管理方法中,使用计算机解决问题主要采用数据驱动的方法,也就是从样本数据中建立统计模型,挖掘统计规律来解决问题。为了提高效果,数据驱动的方法通常需要较多样本数据。但是,即使样本数据量再大,单纯的数据驱动方法的效果也会受到限制,数据质量同样深刻的影响着数据驱动方法的应用,需要通过知识引导的方法突破数据驱动的“天花板”。
发明内容
本发明为解决上述背景技术中存在的技术问题,通过本体建模的方式高新技术园区提供一种知识驱动的企业信息管理方法、系统及介质,有效提高园区内企业信息的快速查询、企业信息纠错、园区内企业关系计算出,并对园区内企业的发展前景进行预测,提高高新技术园区内企业管理效率。
本发明采用以下技术方案:一种知识驱动的企业信息处理方法,包括:
从数据库的原始数据(企业信息数据库、报表等)中提取待分析数据;
构建数据字典,规范待分析数据中的数据本体的概念和语义;
基于数据字典,从待分析数据中抽取层次关系和非层次关系;
对数据本体的属性增加约束函数;导入数据库中的其他原始数据,经转换创建数据本体的个体实例;
构建模型实现原始数据之间潜在关系的挖掘与补全。
根据本发明的一个方面,所述构建数据字典是根据本体的范围和领域,罗列出本体中重要的概念,并将概念梳理成数据字典,确定概念的数据类型和取值范围。
在进一步的实施例中,所述构建数据字典具体包括以下步骤:
对待分析数据进行术语抽取;
对抽取的数据进行语义分析;
在语义分析后的数据中进行概念抽取,形成数据字典。
根据本发明的一个方面,所述术语抽取的步骤具体包括:要对数据进行预处理,包括格式转换、去噪、分词、词性标注;采用统计或规则的方法从数据中提取候选术语,通过统计参数或规则过滤候选术语以获取领域术语列表。
根据本发明的一个方面,所述语义分析采用LPIR-Parser大数据语义智能分析平台,实现精准采集,文档格式转换、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重。
根据本发明的一个方面,所述概念抽取,将领域文档集通过分词工具进行分词、词性标注,通过单字合并法得到一部分含有单字的概念集合,经领域专家审核后形成概念集合。
在进一步的实施例中,所述层次关系表示:概念间的结构性上下层关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京德奈特系统科技有限责任公司,未经南京德奈特系统科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110534125.2/2.html,转载请声明来源钻瓜专利网。