[发明专利]基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统有效

专利信息
申请号: 201610716109.4 申请日: 2016-08-24
公开(公告)号: CN107783973B 公开(公告)日: 2022-02-25
发明(设计)人: 何超;梁颖琪;车慧诗 申请(专利权)人: 慧科讯业有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F16/953;G06F16/28
代理公司: 北京市君合律师事务所 11517 代理人: 王昭林;唐宇
地址: 中国香港湾仔告士打道1*** 国省代码: 香港;81
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 行业 知识 图谱 数据库 互联网 媒体 事件 进行 监测 方法 装置 系统
【说明书】:

发明提供了一种构建行业知识图谱数据库的方法,包括以下步骤:从数据源获取行业数据;对所述行业数据进行数据处理,以提取与所述行业相关的实体以及对应的实体属性和/或实体关系;基于所提取的实体、实体属性和/或实体关系构建所述行业知识图谱数据库。本发明还提供了一种基于所构建的行业知识图谱数据库对与行业相关的特定媒体事件进行监测的方法,包括以下步骤:获取互联网媒体数据;基于所获取的互联网媒体数据进行事件检测、事件评价和筛选,以获取所述与行业相关的特定媒体事件;识别与所述特定媒体事件对应的直接相关实体;基于所述直接相关实体,访问所述行业知识图谱数据库,以确定与所述特定媒体事件对应的非直接相关实体;向所述直接相关实体和/或所述非直接相关实体发送预警消息。

技术领域

本发明涉及互联网媒体监测领域,具体而言,涉及一种构建行业知识图谱数据库的技术以及一种基于所构建的行业知识图谱数据库对互联网媒体事件进行监测的技术。

背景技术

计算机、通信以及网络技术的迅速发展使包括PC、平板电脑、智能手机、网络电视等在内的终端设备的性能不断提高。相应地,互联网媒体,特别是互联网社交媒体,凭借其多元性、迅捷性、交互性、易复制性、多媒体化等特点,已逐渐成为大众获取新闻资讯的主要途径之一。

然而,互联网媒体信息在具有时效性强、获取方式灵活便捷等优势的同时,其信息源和传播方式的开放性特点也导致了以下问题的存在:在未经授权或证实的情况下,一些敏感消息(例如,商业秘密)甚至虚假消息在互联网媒体平台上被大量用户快速传播,从而演变为对相关的个人、企业/机构、行业乃至社会造成不良影响的媒体事件。因此,需要对互联网媒体中的媒体事件进行监测,并在监测到满足一定条件的媒体事件后采取相应的措施,以降低或消除其潜在的影响。

现有的互联网媒体监测技术则存在以下缺陷:1)使用兴趣匹配的方式为用户提供互联网媒体监测,用户需要自定义感兴趣的内容主题、相关实体等,因此在监测中仅能够识别与用户已定义的实体直接相关的事件,而无法识别用户未定义但是与用户所感兴趣的实体间接相关的事件;2)监测对象的属性单一,仅能够提供针对单一媒体类别和数据源(例如,特定的社交媒体、新闻媒体、论坛、博客等)、单一数据类型(一般为文本)、单一语言的监测。

发明内容

本发明的一个目的是提供一种构建行业知识图谱数据库的技术,将针对特定行业或领域的相关数据提取并保存在知识图谱数据库中,所构建的行业知识图谱数据库可以应用于互联网媒体监测中,以实现对相关互联网媒体事件的自动化、深层次监测。

本发明的另一个目的是提供一种基于所构建的行业知识图谱数据库对互联网媒体事件进行监测的技术,在监测中能够识别出与特定媒体事件对应的非直接相关实体,并且能够对多种类型的互联网媒体数据进行监测。

为了实现上述发明目的,本发明提供的具体技术方案如下。

本发明提供了一种构建行业知识图谱数据库的方法,包括以下步骤:从数据源获取行业数据;对所述行业数据进行数据处理,以提取与所述行业相关的实体以及对应的实体属性和/或实体关系;基于所提取的实体、实体属性和/或实体关系构建所述行业知识图谱数据库。

优选地,所述获取行业数据的步骤通过以下方式实现:从第三方行业数据库获取结构化行业数据,所述结构化行业数据包括多个字段;所述对行业数据进行数据处理的步骤通过以下方式实现:对所述结构化行业数据进行数据清洗以及抽取-转换-加载(ETL)处理;所述构建行业知识图谱数据库的步骤通过以下方式实现:基于所提取的实体、实体属性和/或实体关系生成所述行业知识图谱数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧科讯业有限公司,未经慧科讯业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610716109.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top