[发明专利]舆情监测方法及装置、电子设备及存储介质有效
| 申请号: | 202110215392.3 | 申请日: | 2021-02-25 |
| 公开(公告)号: | CN113392195B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 张一尼;李亚军;李宏欣;陈春华;白松;郝勇;陈靖博;李浩纲;季刚 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06F16/951;G06F40/242;G06F40/284;G06N3/0442;G06N3/08 |
| 代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
| 地址: | 450001 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 舆情 监测 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种舆情监测方法、舆情监测装置、电子设备和计算机可读存储介质。其中,方法包括:获取待分析文本;采集待分析文本的相关新闻,其中,相关新闻至少包含一篇新闻;将相关新闻转化为关键词‑权重列表;根据待分析文本及相关新闻的关键词‑权重列表划分相关新闻为多个主题;获取主题对应的相关新闻的评论;基于预先训练好的情感分析模型对评论进行情感分析,得到待分析文本的舆情监测结果。本方法设计了相应的舆情分析系统,实现对网络媒体进行数据检索、热点事件聚类抽取、情感分析的自动化流程,为舆情监测智能系统的研发奠定技术基础。
技术领域
本公开涉及数据处理领域,尤其涉及一种舆情监测方法、舆情监测装置、电子设备和计算机可读存储介质。
背景技术
网络舆情是指在网络上流行的对社会事件不同看法的网络舆论,是社会舆论的一种表现形式。近年来,网络舆情对生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,随着大数据时代的发展,舆情监测的要求越来越高。但由于国内绝大多数的研究对象仍旧以汉语和英语为主,相比之下,对其他自然语言处理的研究起步较晚,基础研究相对薄弱,而且目前国内从事其他自然语言处理的研究人员和团队较少,因此,网络舆情状态的监测就变得尤为重要。
目前舆情系统大多是通过舆情分析师筛选舆情,然后对系统进行跟踪,从而对事件在影响力上对其舆情状态有一个大致的判断,但是这种方案存在监测数据源不够全面,无法实现实时分析监测,且无法直观地了解到网络舆情的舆情状态,进而导致无法及时准确地获取有效信息辅助商业决策。
发明内容
为克服相关技术中存在的问题,本公开提供一种舆情监测方法及装置、电子设备和计算机可读存储介质。
根据本公开实施例的第一方面,提供一种舆情监测方法,方法包括:获取待分析文本;采集待分析文本的相关新闻,其中,相关新闻至少包含一篇新闻;将相关新闻转化为关键词-权重列表;根据待分析文本及相关新闻的关键词-权重列表划分相关新闻为多个主题;获取主题对应的相关新闻的评论;基于预先训练好的情感分析模型对评论进行情感分析,得到待分析文本的舆情监测结果。
在一实施例中,采集待分析文本的相关新闻,包括:抽取待分析文本的关键词;利用关键词在选定数据源中检索,得到与待分析文本相关的新闻数据;根据选定数据源的反爬虫机制改进采集算法;利用改进的采集算法获取相关的新闻数据,得到相关新闻集合。
在一实施例中,将相关新闻转化为关键词-权重列表,包括:逐一对相关新闻中的每篇新闻进行形态素分析,获得新闻的形态素文本;提取新闻的关键词集合,关键词集合包含新闻的形态素文本中所有的不重复形态素;确定每个关键词权重,关键词权重为关键词的TF-IDF值;基于关键词的权重筛选并构建新闻的关键词-权重列表。
在一实施例中,确定每个关键词权重,关键词权重为关键词的TF-IDF值,包括:在预先构建好的IDF词典内查找关键词对应的IDF值,其中,IDF词典包含新闻语料数据库中所有关键词和IDF值的对应关系;基于关键词的IDF值,计算关键词的TF-IDF值。
在一实施例中,根据待分析文本及相关新闻的关键词-权重列表划分相关新闻为多个主题,包括:根据待分析文本及相关新闻的关键词-权重列表,确定所有相关新闻与待分析文本的关联度;根据关联度进行聚类,将相关新闻划分为多个聚类主题。
在一实施例中,基于预先训练好的情感分析模型对评论进行情感分析,得到待分析文本的舆情监测结果,包括:基于预先训练好的情感分析模型得到评论的情感倾向;计算所有评论中关键词的权重,根据权重确定高频词;统计所有评论的情感倾向及高频词,通过可视化技术展示给用户。
在一实施例中,情感分析模型包括基于深度学习的情感分析模型、基于情感词典的情感分析模型和深度学习与情感词典融合的情感分析模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110215392.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于运行纺织机的方法和纺织机
- 下一篇:一种用于检测筒状零件吊挂高度的夹具





