[发明专利]一种基于深度学习面向公检法领域的舆情等级预测方法有效

专利信息
申请号: 202110608376.0 申请日: 2021-06-01
公开(公告)号: CN113312532B 公开(公告)日: 2022-10-21
发明(设计)人: 赵铁军;杨沐昀;徐冰;郭常江;曹海龙;朱聪慧 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F16/951 分类号: G06F16/951;G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 哈尔滨市阳光惠远知识产权代理有限公司 23211 代理人: 刘景祥
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 面向 公检法 领域 舆情 等级 预测 方法
【说明书】:

发明公开一种基于深度学习面向公检法领域的舆情等级预测方法。步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;步骤3:将步骤2的舆情等级预测结果存储至系统数据库;步骤4:在数据库中对舆情等级做出相应标识;步骤5:对标识后的数据库中舆情等级提供可访问舆情信息的数据接口;步骤6:通过数据接口在系统中显示舆情等级预测结果。本发明用以解决舆情系统没有针对性的问题,跳出算法的限制。

技术领域

本发明属于自然语言处理技术领域,具体涉及一种基于深度学习面向公检法领域的舆情等级预测方法。

背景技术

舆情监测,或者说舆情预警是一项交叉了社会科学和数据科学的复杂技术,需要在舆情发生初期对事件有个初步的等级预判,充分做好应对准备。而想要让机器自动化达到这样的目的,就需要大量的数据和可靠的模型进行支撑。

针对舆情事件的描述,主要来自网络媒体上的新闻文本和类似新浪微博的社交平台,人们通过阅读、转发、评论等,直接告知他人或者从他人那里间接了解到舆情事件的相关信息。舆情系统可针对这些事件信息从中提取特征(文本特征,描述事件的具体情况;数据特征,描述事件的传播情况)进一步分析舆情当前的发酵情况和传播态势。其中重要的一点就是分析舆情的预警等级,可以说是舆情系统中不可或缺的一环。

但是目前存在的舆情系统中的舆情等级预测功能有以下几个问题:

一、目前主要使用人工的方式监督舆情,并分析舆情等级,虽然针对单个舆情比较有效,但是舆情的收集有限制,舆情发现也并不及时,需要有一个自动化的舆情分析系统来辅助人工预判;

二、舆情系统没有针对性,舆情本身因为其广泛性,涵盖了各个领域,然而针对各个领域的舆情,人们的关注点总是不同的,因此不能采用一个通用的方式进行分析,而目前几乎没有针对公检法领域的舆情事件等级预测;

三、目前使用的技术主要是根据数据挖掘算法进行分析,但是由于算法的不可学习性,效果比较一般;而使用深度学习的方式,需要统一构建语料库进行学习,造成目前主要还是使用挖掘算法进行分析。

发明内容

本发明提供一种基于深度学习面向公检法领域的舆情等级预测方法,用以解决上述问题,辅助人工进行舆情监控。

本发明通过以下技术方案实现:

一种基于深度学习面向公检法领域的舆情等级预测方法,所述预测方法包括以下步骤:

步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;

步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;

步骤3:将步骤2的舆情等级预测结果存储至系统数据库;

步骤4:在数据库中对舆情等级做出相应标识;

步骤5:对标识后的数据库中舆情等级提供可访问舆情信息的数据接口;

步骤6:通过数据接口在系统中显示舆情等级预测结果。

进一步的,所述步骤1具体包括以下步骤:

步骤J1.1:爬取得到原始的JSON文件,判断其是否为UTF-8编码,若是则无需转换,若不是则将其编码格式转为UTF-8编码;

步骤J1.2:在UTF-8编码格式的JSON文件中检索,提取出转发量、评论量、评论文本及正文的信息;

步骤J1.3:使用正则表达式对提取出的文本进行清洗,保留中文、英文和数字字符,去除其中的网页链接、标签、表情符号,过滤掉非中文字符;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110608376.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top