[发明专利]虚假网络舆情识别方法在审
申请号: | 201810451684.5 | 申请日: | 2018-05-12 |
公开(公告)号: | CN108563798A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 赵乔 | 申请(专利权)人: | 苏州华必讯信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215300 江苏省苏州市昆山市玉*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络舆情识别 网络舆情 关联性 关联性分析 空间关联性 时间关联性 信息量减少 建模分析 网络论坛 网络热点 网络信息 信息传播 行为分析 行为特征 网络 互联网 检测 | ||
本发明公开了一种虚假网络舆情识别方法,用于解决现有的互联网虚假网络舆情识别方法需要处理大量网络信息的技术问题。技术方案是首先采用行为分析技术,对网络论坛信息传播行为进行建模分析,检测出网络热点事件和舆情。然后依据网络水军行为特征,对网络舆情进行多个层面关联性分析,包括空间关联性、时间关联性、主题关联性以及情感关联性等,识别出可能存在的虚假网络舆情。将所处理的网络信息量减少到了最低限度。
技术领域
本发明属于互联网舆情分析和识别领域,具体涉及一种虚假网络舆情识别方法。
背景技术
我国网民已超过5亿人,很多网民将互联网视为了解社情民意、揭露社会弊端、开展社会监督的窗口,很多的社会热点事件都是由网络舆论率先关注、继而引发媒体报道的。互联网已成为新闻舆论监督的重要平台,特别是以多元化、交互式为特点的网络论坛成为网络舆论的主要来源。
国内外相关研究主要集中在网络舆情分析技术上,很少涉及虚假网络舆情分析和识别问题。对于网络舆情分析技术,可分为两大类:一是基于内容的舆情分析方法,主要采用网络文本分析技术对网络论坛热点话题进行检测,这种方法需要借助于文字信息处理平台对文本内容进行分析,数据处理量大,处理效率低,不适合于对网络水军所引发的大规模虚假网络舆情的识别和监测;二是基于行为的舆情分析方法,主要采用复杂网络分析方法对网络信息传播行为进行分析,从中寻找网络舆情发生和演化规律,同样这种方法也不适合直接用来对虚假网络舆情的识别和监测。
由于虚假网络舆情是互联网中新兴起的不良现象,目前国内外还缺乏系统深入的研究,尚未提出有效的虚假网络舆情识别方法。
对于互联网各大网络论坛,存在如下事实:(1)网络论坛中大多数帖子是一般性的,能够引发热点事件而形成网络舆情的帖子只占少数;(2)在发生的网络舆情中,由网络水军引发的虚假网络舆情占50%左右。
发明内容
为了克服现有的互联网虚假网络舆情识别方法需要处理大量网络信息的不足,本发明提供一种虚假网络舆情识别方法。该方法采用行为分析和内容分析相结合的逐步求精处理方法,首先采用行为分析技术,对网络论坛信息传播行为进行建模分析,检测出网络热点事件和舆情。然后依据网络水军行为特征,对网络舆情进行多个层面关联性分析,包括空间关联性、时间关联性、主题关联性以及情感关联性等,识别出可能存在的虚假网络舆情。可将所处理的网络信息量减少到最低限度。
本发明解决其技术问题所采用的技术方案是:一种虚假网络舆情识别方法,其特点是包括以下步骤:
步骤一、利用网络数据采集工具,从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容,提取其中的元信息,网络信息经过数据清洗等预处理后存入数据库待分析。
步骤二、对于每个被监测的网络论坛,按下列方法检测是否存在网络舆情或热点事件。
以用户为节点,用户之间的联系为节点之间的连线,建立用户-用户网络模型。通过用户-用户之间的联系形成有向网络,在一个带值的有向网络中,一个节点的威望度是指这个节点的入度与所有节点的入度和的比值,威望度计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州华必讯信息科技有限公司,未经苏州华必讯信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810451684.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页内容有分页的抓取方法
- 下一篇:一种动态生成舆情简报的方法