[发明专利]一种基于知识图谱的大数据显示方法有效
申请号: | 201911387164.3 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111143547B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 陈琳 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/36 |
代理公司: | 北京嘉途睿知识产权代理事务所(普通合伙) 11793 | 代理人: | 彭成 |
地址: | 250100 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 数据 显示 方法 | ||
本发明中保护一种基于知识图谱的大数据显示方法,知识图谱的展示方法通过数据元素的语义描述信息进行高频元素文本文档统计汇总,采用关系化布局算法,相对于相关技术中的知识图谱展示方式,采用本发明实施例中的知识图谱展示方式可以有效解决相关技术中存在的知识图谱展示缓慢的问题,达到快速有效的展示知识图谱的效果;并且其采用知识图谱美化算法将知识图谱中降噪处理知识图谱中的冲突现象,采用美化算子以图结构为基础,以实体图谱层级为起点按照边和图谱层级的关系对知识图谱中错误的实体和关系进行美化并对美化后的知识图谱进行评价,保证了知识图谱的展示效果符合视觉需要。
技术领域
本发明涉及知识图谱领域,具体而言,涉及一种基于知识图谱的大数据显示方法。
背景技术
知识图谱(Knowledge Graph/Vault)又称为科学知识图谱,是显示知识发展进程与结构关系的一系列各种不同的图形,它充分利用人工智能(AI,ArtificialIntelligence)技术把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制抽象成实体而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
在进行知识图谱的页面展示时,经常因为展示的数据(图谱层级+关系)数量巨大,而导致无法展示,甚至机器崩溃。因此,在相关技术中,在进行页面展示的时候,一般会通过一定的延迟,进行缓慢加载和缓慢渲染,进行更大数据量的展示。但是上述处理方式并不能从根本上解决知识图谱数据量大,无法展示的问题;并且当知识图谱中包括的数据量进一步加大时,依然会出现崩溃的问题,从而导致展示速度更加缓慢。
面对庞大用户数据,必然要面临信息超载的问题,要解决这样的问题有两种方式,一种是增加工作人数,这样势必增加管理与生产成本,另一种方法是利用计算机可视化技术在有限的用户界面中对多维复杂的数据以符合感知与认知规律的方式进行图形呈现,帮助发现洞察数据的真实含义。
发明内容
鉴于针对大数据可视化出现的上述问题,本发明请求保护一种基于知识图谱的大数据显示方法,可有效的对数据进行知识图谱的可视化展示,并可对图谱进行质量修订和评价。
本发明请求保护一种基于知识图谱的大数据显示方法,其特征在于:
步骤1:获取大数据地址信息,下载大数据分页数据内容,对内容信息进行层级分析,从上所述大数据分页数据中提取出用户关注的信息并进行数据采集,形成数据采集文档并存储;
步骤2:对数据采集文档中所包含不同类型数据进行可视化编码,以合适呈现方式设计可视化图形进行元素抽取,然后依据数据采集文档中句子计算任意两个元素语之间的语义联系形成一个语义描述矩阵,矩阵中对应位置的值代表着元素之间语义描述的远近,得到文本中元素之间的语义描述;
步骤3:依据语义描述矩阵构建图谱语料,对图谱语料进行停用词和表达符号的删除处理,将语料分词后建立元素矩阵,进行高频元素统计,获得高频元素文本文档;
步骤4:通过所述高频元素文本文档,采用关系化布局算法,将所述高频元素文本文档的元素设置在二维空间上,元素之间的距离完全取决于它们之间的语义描述,将摆放好的元素依据它们之间的语义描述进行聚类,使得同一个聚类的信息表达一个主题,将聚类信息通过三级影响度标识并将所述三级影响度标识标注于构建的知识图谱旁;
步骤5:依据三级影响度标识标注的知识图谱,使用元素语义,以适合基于语义的文本可视化展示中语义信息的保留,采用知识图谱重叠消除算法,去除知识图谱中的多层重复图层;
步骤6:采用知识图谱美化算法将知识图谱中降噪处理知识图谱中的冲突现象,采用美化算子以图结构为基础,以实体图谱层级为起点按照边和图谱层级的关系对知识图谱中错误的实体和关系进行美化;
步骤7:对美化后的知识图谱进行评价,所述评价指标包括:层级数据、时域数据和主题文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911387164.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:辅助识别爬虫的、爬虫识别方法、装置及电子设备
- 下一篇:一种视频分类输入系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置