[发明专利]基于数据模型构建数据图谱的方法及构建数据图谱的系统有效
| 申请号: | 201911074301.8 | 申请日: | 2019-11-06 |
| 公开(公告)号: | CN110866123B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 苏川川;房爱印;王勇强;刘功胜;路中振 | 申请(专利权)人: | 浪潮软件集团有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/335;G06F16/35 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据模型 构建 数据 图谱 方法 系统 | ||
本发明公开了一种基于数据模型构建数据图谱的方法及构建数据图谱的系统,属于数据图谱领域,要解决的技术问题为如何将数据以数据图谱的形式进行存储以提高数据查询效率。方法包括:对数据资源进行聚类分析;根据上述聚类分析得到的类结合不同的业务场景建立本体模型;结合场景对上述聚类分析得到的类进行关联分析,得到领域模型;对本体模型属性和数据库字段进行对应,得到数据映射关系;生成图谱数据并得到数据图谱;得到超级档案。系统包括聚类分析模块、本体模型构建模块、本体模型构建模块、领域模型构建模块、数据映射模块、数据抽取模块以及超级档案构建模块。
技术领域
本发明涉及数据图谱领域,具体地说是一种基于数据模型构建数据图谱的方法及构建数据图谱的系统。
背景技术
近年来,数字经济已经成为全球经济发展的新引擎,未来也将成为中国领先全球、率先打开第四次工业革命之门的“钥匙”。以人工智能技术为基础,将大数据与业务相结合打造创新为核心的大数据应用,积极推动数字经济发展、完善社会治理、提升政府服务和监管能力正成为我国大数据产业发展的趋势。对政府来说,大数据既包括来源于跨部门、跨系统的业务数据,也包括来源于公共服务的社会数据,还包括互联网、移动互联网、物联网等来源的其他数据,如何实现这些多源、异构数据的融合和关联,进而从大数据中洞察价值,助推社会公共安全有效治理、纳税人风险尽早识别,是社会和政府共同关注的课题。对大型企业来说,随着客户集团化以及供应链、担保链、资金链的不断发展,大企业的风险模式更加复杂隐蔽,容易发生牵一发而动全身的连锁风险,传统的风险控制体系已经不足以解决多发的关联性风险,如何实现企业大数据的融合关联,真正解决企业风险控制的痛点,是企业大数据分析面临的最大挑战。当前市场对这些数据的利用还主要集中在简单的查询及报表统计等层次,人员信息、企业信息等各种数据相互之间的多级关联数据大多是存储在传统关系型数据库中,通过外键等形式建立关联关系进行查询。
这种多级关联的数据在查询时会随着关系复杂度的增加查询时间呈现几何式增长,我们查询小明的朋友会消耗0.1秒,当我们查询小明的朋友的朋友的朋友等关系时则会消耗上百倍甚至更多的时间,极为耗费资源,而且难以真正发现数据背后的隐藏价值,探索事件的“幕后黑手”。
知识图谱正在成为实现多源异构超媒体数据融合的一种关键技术。知识图谱本质上是一种语义网络,基于知识图谱技术的本体建模,本质上是为多源、异构、类型多样的大数据提供了一种高抽象概念层次的统一数据模型。基于这样一个数据模型,通过一组图谱生成工具把各种来源、异构、海量的大数据进行汇聚、融合、和关联在一起进行存储。基于知识图谱的大数据分析,实现了大数据的本质语义关联,比传统的关系型数据库更加自由多样化,能够更好地满足用户对大数据金矿的价值探索和情报发现需求。
传统关系型数据库在大数据量多级复杂关系查询时会极大的降低查询效率,而且在数据相关性、推荐算法等方面显得更加无力,严重影响数据计算分析和用户体验基于上述分析,基于上述缺陷,如何将数据以数据图谱的形式进行存储以提高数据查询效率,是需要解决的技术问题。
发明内容
本发明的技术任务是针对以上不足,提供一种基于数据模型构建数据图谱的方法及构建数据图谱的系统,来解决如何将数据以数据图谱的形式进行存储以提高数据查询效率的问题。
第一方面,本发明提供一种基于数据模型构建数据图谱的方法,包括如下步骤:
S100、对数据资源进行聚类分析,将数据对象分类至不同的类或簇,得到多个类,每个类中的数据对象相似,不同类之间的数据对象相异;
S200、根据上述聚类分析得到的类结合不同的业务场景建立本体模型,每个本体模型对应一个类;
S300、结合场景对上述聚类分析得到的类进行关联分析,得到领域模型;
S400、基于本体模型与关系数据库的实体之间的对应关系,对本体模型属性和数据库字段进行对应,得到数据映射关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911074301.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





