[发明专利]虚假网络舆情识别方法在审

申请号：	201810451684.5	申请日：	2018-05-12
公开（公告）号：	CN108563798A	公开（公告）日：	2018-09-21
发明（设计）人：	赵乔	申请（专利权）人：	苏州华必讯信息科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	215300 江苏省苏州市昆山市玉***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	网络舆情识别网络舆情关联性关联性分析空间关联性时间关联性信息量减少建模分析网络论坛网络热点网络信息信息传播行为分析行为特征网络互联网检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种虚假网络舆情识别方法，用于解决现有的互联网虚假网络舆情识别方法需要处理大量网络信息的技术问题。技术方案是首先采用行为分析技术，对网络论坛信息传播行为进行建模分析，检测出网络热点事件和舆情。然后依据网络水军行为特征，对网络舆情进行多个层面关联性分析，包括空间关联性、时间关联性、主题关联性以及情感关联性等，识别出可能存在的虚假网络舆情。将所处理的网络信息量减少到了最低限度。

技术领域

本发明属于互联网舆情分析和识别领域，具体涉及一种虚假网络舆情识别方法。

背景技术

我国网民已超过5亿人，很多网民将互联网视为了解社情民意、揭露社会弊端、开展社会监督的窗口，很多的社会热点事件都是由网络舆论率先关注、继而引发媒体报道的。互联网已成为新闻舆论监督的重要平台，特别是以多元化、交互式为特点的网络论坛成为网络舆论的主要来源。

国内外相关研究主要集中在网络舆情分析技术上，很少涉及虚假网络舆情分析和识别问题。对于网络舆情分析技术，可分为两大类：一是基于内容的舆情分析方法，主要采用网络文本分析技术对网络论坛热点话题进行检测，这种方法需要借助于文字信息处理平台对文本内容进行分析，数据处理量大，处理效率低，不适合于对网络水军所引发的大规模虚假网络舆情的识别和监测；二是基于行为的舆情分析方法，主要采用复杂网络分析方法对网络信息传播行为进行分析，从中寻找网络舆情发生和演化规律，同样这种方法也不适合直接用来对虚假网络舆情的识别和监测。

由于虚假网络舆情是互联网中新兴起的不良现象，目前国内外还缺乏系统深入的研究，尚未提出有效的虚假网络舆情识别方法。

对于互联网各大网络论坛，存在如下事实：(1)网络论坛中大多数帖子是一般性的，能够引发热点事件而形成网络舆情的帖子只占少数；(2)在发生的网络舆情中，由网络水军引发的虚假网络舆情占50％左右。

发明内容

为了克服现有的互联网虚假网络舆情识别方法需要处理大量网络信息的不足，本发明提供一种虚假网络舆情识别方法。该方法采用行为分析和内容分析相结合的逐步求精处理方法，首先采用行为分析技术，对网络论坛信息传播行为进行建模分析，检测出网络热点事件和舆情。然后依据网络水军行为特征，对网络舆情进行多个层面关联性分析，包括空间关联性、时间关联性、主题关联性以及情感关联性等，识别出可能存在的虚假网络舆情。可将所处理的网络信息量减少到最低限度。

本发明解决其技术问题所采用的技术方案是：一种虚假网络舆情识别方法，其特点是包括以下步骤：

步骤一、利用网络数据采集工具，从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容，提取其中的元信息，网络信息经过数据清洗等预处理后存入数据库待分析。

步骤二、对于每个被监测的网络论坛，按下列方法检测是否存在网络舆情或热点事件。

以用户为节点，用户之间的联系为节点之间的连线，建立用户－用户网络模型。通过用户－用户之间的联系形成有向网络，在一个带值的有向网络中，一个节点的威望度是指这个节点的入度与所有节点的入度和的比值，威望度计算公式如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州华必讯信息科技有限公司，未经苏州华必讯信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810451684.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]虚假网络舆情识别方法在审

专利文献下载