[发明专利]一种基于知识图谱的大数据显示方法有效

专利信息
申请号: 201911387164.3 申请日: 2019-12-30
公开(公告)号: CN111143547B 公开(公告)日: 2020-09-01
发明(设计)人: 陈琳 申请(专利权)人: 山东大学
主分类号: G06F16/34 分类号: G06F16/34;G06F16/36
代理公司: 北京嘉途睿知识产权代理事务所(普通合伙) 11793 代理人: 彭成
地址: 250100 *** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 数据 显示 方法
【权利要求书】:

1.一种基于知识图谱的大数据显示方法,其特征在于:

步骤1:获取大数据地址信息,下载大数据分页数据内容,对内容信息进行层级分析,从上所述大数据分页数据中提取出用户关注的信息并进行数据采集,形成数据采集文档并存储;

步骤2:对数据采集文档中所包含不同类型数据进行可视化编码,以合适呈现方式设计可视化图形进行元素抽取,然后依据数据采集文档中句子计算任意两个元素语之间的语义联系形成一个语义描述矩阵,矩阵中对应位置的值代表着元素之间语义描述的远近,得到文本中元素之间的语义描述;

步骤3:依据语义描述矩阵构建图谱语料,对图谱语料进行停用词和表达符号的删除处理,将语料分词后建立元素矩阵,进行高频元素统计,获得高频元素文本文档;

步骤4:通过所述高频元素文本文档,采用关系化布局算法,将所述高频元素文本文档的元素设置在二维空间上,元素之间的距离完全取决于它们之间的语义描述,将摆放好的元素依据它们之间的语义描述进行聚类,使得同一个聚类的信息表达一个主题,将聚类信息通过三级影响度标识并将所述三级影响度标识标注于构建的知识图谱旁;

步骤5:依据三级影响度标识标注的知识图谱,使用元素语义,以适合基于语义的文本可视化展示中语义信息的保留,采用知识图谱重叠消除算法,去除知识图谱中的多层重复图层;

步骤6:采用知识图谱美化算法将知识图谱中降噪处理知识图谱中的冲突现象,采用美化算子以图结构为基础,以实体图谱层级为起点按照边和图谱层级的关系对知识图谱中错误的实体和关系进行美化;

步骤7:对美化后的知识图谱进行评价,所述评价指标包括:层级数据、时域数据和主题文本数据。

2.如权利要求1所述的一种基于知识图谱的大数据显示方法,其特征在于:

所述步骤1:获取大数据地址信息,下载大数据分页数据内容,对内容信息进行层级分析,从上所述大数据分页数据中提取出用户关注的信息并进行数据采集,形成数据采集文档并存储,具体包括:

对下载的大数据分页数据内容进行层级划分,社交网络层为最顶层,即根图谱层级,其下层,即子图谱层级,是包括各类分区的区域层,在区域层下是包含各类论坛的论坛层,直到社区底层的主题层,采集用户关注的信息数据;

对采集到的所述用户关注的信息数据进行数据处理,并以结构化的方式存储起来,所述结构化方式为JSON数据结构存储,所有论坛以对象数组的形式保存,每个对象包括论坛名称、地址、层级深度、父层级名称、子层级名称矩阵、当日主题数、主题总数以及发帖总数,周期性在虚拟机服务器后台进行定时任务,对整个社交网络数据进行遍历,将论坛对象数组添加时间信息后,存入数据库;

所述将论坛对象数组添加时间信息时选择论坛数组上的主题Ti相应的部分Ai,其时间信息采用区间标识,开始标识tstart和结束标识tend之间的时间构成了所述区间标识[tstart·tend],将所述区间等分成m-1段,每个时间段的长度为得到均分时刻tstart+pΔt,其中p=1,2,…m-2;

依次以均分时刻tstart+pΔt为核心,依据Δt在部分Ai上挖取子部分Ai,j,在每一个子部分上放置所述对象中的元素值,生成主题Ti的知识图谱草稿并存入数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911387164.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top