[发明专利]一种基于知识图谱的大数据显示方法有效

专利信息
申请号: 201911387164.3 申请日: 2019-12-30
公开(公告)号: CN111143547B 公开(公告)日: 2020-09-01
发明(设计)人: 陈琳 申请(专利权)人: 山东大学
主分类号: G06F16/34 分类号: G06F16/34;G06F16/36
代理公司: 北京嘉途睿知识产权代理事务所(普通合伙) 11793 代理人: 彭成
地址: 250100 *** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 数据 显示 方法
【说明书】:

发明中保护一种基于知识图谱的大数据显示方法,知识图谱的展示方法通过数据元素的语义描述信息进行高频元素文本文档统计汇总,采用关系化布局算法,相对于相关技术中的知识图谱展示方式,采用本发明实施例中的知识图谱展示方式可以有效解决相关技术中存在的知识图谱展示缓慢的问题,达到快速有效的展示知识图谱的效果;并且其采用知识图谱美化算法将知识图谱中降噪处理知识图谱中的冲突现象,采用美化算子以图结构为基础,以实体图谱层级为起点按照边和图谱层级的关系对知识图谱中错误的实体和关系进行美化并对美化后的知识图谱进行评价,保证了知识图谱的展示效果符合视觉需要。

技术领域

本发明涉及知识图谱领域,具体而言,涉及一种基于知识图谱的大数据显示方法。

背景技术

知识图谱(Knowledge Graph/Vault)又称为科学知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,它充分利用人工智能(AI,ArtificialIntelligence)技术把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制抽象成实体而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。

在进行知识图谱的页面展示时,经常因为展示的数据(图谱层级+关系)数量巨大,而导致无法展示,甚至机器崩溃。因此,在相关技术中,在进行页面展示的时候,一般会通过一定的延迟,进行缓慢加载和缓慢渲染,进行更大数据量的展示。但是上述处理方式并不能从根本上解决知识图谱数据量大,无法展示的问题;并且当知识图谱中包括的数据量进一步加大时,依然会出现崩溃的问题,从而导致展示速度更加缓慢。

面对庞大用户数据,必然要面临信息超载的问题,要解决这样的问题有两种方式,一种是增加工作人数,这样势必增加管理与生产成本,另一种方法是利用计算机可视化技术在有限的用户界面中对多维复杂的数据以符合感知与认知规律的方式进行图形呈现,帮助发现洞察数据的真实含义。

发明内容

鉴于针对大数据可视化出现的上述问题,本发明请求保护一种基于知识图谱的大数据显示方法,可有效的对数据进行知识图谱的可视化展示,并可对图谱进行质量修订和评价。

本发明请求保护一种基于知识图谱的大数据显示方法,其特征在于:

步骤1:获取大数据地址信息,下载大数据分页数据内容,对内容信息进行层级分析,从上所述大数据分页数据中提取出用户关注的信息并进行数据采集,形成数据采集文档并存储;

步骤2:对数据采集文档中所包含不同类型数据进行可视化编码,以合适呈现方式设计可视化图形进行元素抽取,然后依据数据采集文档中句子计算任意两个元素语之间的语义联系形成一个语义描述矩阵,矩阵中对应位置的值代表着元素之间语义描述的远近,得到文本中元素之间的语义描述;

步骤3:依据语义描述矩阵构建图谱语料,对图谱语料进行停用词和表达符号的删除处理,将语料分词后建立元素矩阵,进行高频元素统计,获得高频元素文本文档;

步骤4:通过所述高频元素文本文档,采用关系化布局算法,将所述高频元素文本文档的元素设置在二维空间上,元素之间的距离完全取决于它们之间的语义描述,将摆放好的元素依据它们之间的语义描述进行聚类,使得同一个聚类的信息表达一个主题,将聚类信息通过三级影响度标识并将所述三级影响度标识标注于构建的知识图谱旁;

步骤5:依据三级影响度标识标注的知识图谱,使用元素语义,以适合基于语义的文本可视化展示中语义信息的保留,采用知识图谱重叠消除算法,去除知识图谱中的多层重复图层;

步骤6:采用知识图谱美化算法将知识图谱中降噪处理知识图谱中的冲突现象,采用美化算子以图结构为基础,以实体图谱层级为起点按照边和图谱层级的关系对知识图谱中错误的实体和关系进行美化;

步骤7:对美化后的知识图谱进行评价,所述评价指标包括:层级数据、时域数据和主题文本数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911387164.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top