[发明专利]一种基于地震行业的微博舆情分析方法、装置及电子设备在审
| 申请号: | 202110337955.6 | 申请日: | 2021-03-30 |
| 公开(公告)号: | CN112948587A | 公开(公告)日: | 2021-06-11 |
| 发明(设计)人: | 赵粉玉;邱彦林;朱安安 | 申请(专利权)人: | 杭州叙简科技股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/338;G06F16/383;G06F16/387;G06N3/04;G06N3/08;G06Q50/00;G06Q50/26 |
| 代理公司: | 杭州浙言专利代理事务所(普通合伙) 33370 | 代理人: | 易朝晖 |
| 地址: | 311121 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 地震 行业 舆情 分析 方法 装置 电子设备 | ||
1.一种基于地震行业的微博舆情分析方法,其特征是,所述方法包括:
获取实时微博数据,其中,所述微博数据包括微博信息、微博用户信息和微博评论信息,所述微博信息包括微博内容、微博ID、微博正文链接、点赞数、评论数、转发数、发文时间、发此条微博的用户昵称以及用户ID,所述微博评论信息包括微博ID、评论内容、评论时间、回复数以及点赞数,所述微博用户信息包括用户ID、微博数、粉丝数以及用户所在地区;
将所述实时微博数据输入微博分类模型中获得地震类微博数据和非地震类微博数据,将所述地震类微博数据输入情感倾向模型中获得所述地震类微博数据的情感倾向,其中,所述微博分类模型、所述情感倾向模型均基于深度学习模型Text-CNN使用训练样本分类训练获得;
基于TextRank 算法获取所述地震类微博数据的关键词组;
抽取所述地震类微博数据的地域信息,其中,所述地域信息通过统一的地区编码表示;
将所述地震类微博数据的情感倾向、关键词组、地域信息存放至所述地震类微博数据的微博用户信息的用户信息表中;
将所述用户信息表进行视图展示。
2.根据权利要求1所述的基于地震行业的微博舆情分析方法,其特征是,将所述实时微博数据输入微博分类模型中包括:
将所述实时微博数据发送至kafka相关主题;
订阅所述kafka相关主题获得对应数据输入所述微博分类模型中。
3.根据权利要求1所述的基于地震行业的微博舆情分析方法,其特征是,将所述用户信息表进行视图展示包括:
计算所述地震类微博数据的影响力值;
根据情感倾向为负面的所述地震类微博数据的影响力值制作敏感信息榜,根据地震官方微博数据的粉丝数量、评论数量制作曲线图,根据所述关键词组制作关键词云,根据所述地域信息制作地域分布图;
将所述敏感信息榜、所述曲线图、所述关键词云、所述地域分布图进行视图展示。
4.根据权利要求1所述的基于地震行业的微博舆情分析方法,其特征是,基于TextRank算法获取所述地震类微博数据的关键词组包括:
获取所述地震类微博数据的微博文本;
对所述微博文本进行分词、预处理后,建立大小为n的窗口,对所述微博文本的每个单词进行迭代投票直到收敛,其中,每个单词对距离该单词不超过n/(2+1)内的前后单词进行投票;
将所述微博文本中得票数量超过预设阈值的单词作为所述地震类微博数据关键词组。
5.根据权利要求1所述的基于地震行业的微博舆情分析方法,其特征是,抽取所述地震类微博数据的地域信息包括:
预先将所有的省市名称加入jieba词典中,其中,所述省市名称在jieba词典中的词性被标注为RE;
对所述地震类微博数据使用jieba工具进行分词,抽取词性为RE的词并转化为统一的地区编码。
6.根据权利要求3所述的基于地震行业的微博舆情分析方法,其特征是,所述方法还包括:
将所述敏感信息榜中影响力值超过预设阈值的所述地震类微博数据以及所有所述地震类微博数据中的负面评论制作成告警信息发送至相关工作人员。
7.根据权利要求1所述的基于地震行业的微博舆情分析方法,其特征是,获取
实时微博数据包括:通过爬虫、微博官方API获取实时微博数据,通过实时监测地震官方微博用户获取遗漏的地震类微博数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州叙简科技股份有限公司,未经杭州叙简科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110337955.6/1.html,转载请声明来源钻瓜专利网。





