[发明专利]一种基于主题挖掘和情感分析的微博舆情可视分析方法在审

专利信息
申请号: 202210201566.5 申请日: 2022-03-03
公开(公告)号: CN114579833A 公开(公告)日: 2022-06-03
发明(设计)人: 秦红星;黄辰军 申请(专利权)人: 重庆邮电大学
主分类号: G06F16/951 分类号: G06F16/951;G06F16/9538;G06F16/35
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 廖曦
地址: 400065 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 主题 挖掘 情感 分析 舆情 可视 方法
【说明书】:

发明涉及一种基于主题挖掘和情感分析的微博舆情可视分析方法,属于可视化技术领域。该方法为:S1:确定需要爬取的微博账号,获取所研究微博账号在舆情期间的微博数据;提取所需的研究字段,对获取的研究语料进行预处理;S2:采用贝叶斯模型对微博数据进行主题分类,接着使用TF‑IDF特征提取和LDA主题模型对分类好的语料进行文本主题挖掘,提取微博关键词,最后结合转发数等传播属性,得出热点话题;S3:提取各时间段热点话题的微博评论,得到最终的分类结果,来挖掘人们对热点话题的情感趋势。S4:对两次舆情期间微博舆情进行可视分析。本发明有利于更好的掌握并跟踪微博舆情,提前防范舆情高峰的发生。

技术领域

本发明属于可视化技术领域,涉及一种基于主题挖掘和情感分析的微博舆情可视分析方法。

背景技术

微博作为Web2.0时代的标志性产物,具有重要的意义。微博是在广大社交网络中承载用户关系、分享和传播信息的平台。用户既是信息的接收者,也是信息的生产者和加工者,同时用户与用户间的交互使用户能更多地参与到信息的传播中。简单的收藏或点赞让用户成为了信息传播过程中的参与者。庞大的微博数据中不乏含有一些虚假、措辞激烈和言论不当的信息,同时也存在一些恶意引导舆论走向的用户,这使得微博监管人员不便于及时处理,也让普通用户在茫茫网络大海中不明真正的是非关系。如果微博管理员监管不当,让不实信息流入人群,会使得用户反响强烈,激起社会矛盾;如果用户相信了虚假信息,则让用户偏离了事实真相,同时会让事情的当事人成为网络暴力的受害者。所以对微博数据进行分析研究是当前亟需的问题。

面对这种挑战,微博可视化技术将微博中复杂的或者难以通过文字表达的内容和规律以视觉的形式表达出来,同时向人们提供与视觉信息进行快速交互的功能,使人们能够利用与生俱来的视觉感知的并行化处理能力快速获取大数据中所蕴含的关键信息。大数据分析是大数据研究领域的核心内容之一。想获得信息之中蕴含着的知识与智慧,就需要我们去挖掘数据背后隐藏着的信息。近年来,可视分析研究很大程度上也围绕着大数据的热点领域,例如互联网、社会网络、城市交通、商业智能、气象变化、安全反恐、经济与金融等。

发明内容

有鉴于此,本发明的目的在于提供一种基于主题挖掘和情感分析的微博舆情可视分析方法,解决对现有微博舆情可视分析中缺乏舆情对比分析和对比可视化的问题,使用两次舆情期间的微博数据进行主题分类与话题提取,得出热点话题和主题演化情况。接着获取各时间段热点话题的微博评论,使用扩展词典和FastText分类器进行多次情感分类,来挖掘人们对热点话题的情感趋势。最后,从多方面对两次舆情进行对比可视化,有效地帮助用户掌握并跟踪微博舆情,进行网络舆情监管,提前防范舆情高峰的发生。

为达到上述目的,本发明提供如下技术方案:

一种基于主题挖掘和情感分析的微博舆情可视分析方法,该方法包括以下步骤:

S1:研究数据的获取以及处理,具体分为确定需要爬取的微博账号,获取所研究微博账号在舆情期间的微博数据,提取所需研究字段,对获取的研究语料进行预处理;

S2:采用贝叶斯模型对微博数据进行主题分类,接着使用TF-IDF特征提取和LDA主题模型对分类好的语料进行文本主题挖掘;

S3:提取各时间段热点话题的微博评论,然后使用基于扩展词典的方法进行初步情感分类;接着使用FastText分类器进行二次情感分类,得到最终的分类结果;

S4:对前面得到的微博热点话题和情感趋势采用对比可视化的方法,从时间、空间、热度和用户属性多个层面上对两次舆情期间微博舆情进行可视分析。

可选的,所述S1中,确定需要爬取的微博账号是根据微博媒体的发文情况,选择包括人民网和人民日报有权威的账号。

可选的,所述S1中,对爬取的微博原始数据进行预处理,包括:去除停用词,去除标点,去除副词;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210201566.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top