[发明专利]舆情确定方法、装置、设备及存储介质在审
申请号: | 201910444007.5 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110287315A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 张广学;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤;王静 | 申请(专利权)人: | 厦门快商通信息咨询有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音视频信息 存储介质 特征向量 网站平台 文本信息 监管区域 网络舆情 有效识别 监测 申请 | ||
1.一种舆情确定方法,其特征在于,包括:
在监管区域的网站平台上获取音视频信息;
对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息;
确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型。
2.根据权利要求1所述的舆情确定方法,其特征在于,所述对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息,包括:
从所述音视频信息中提取音频信息;
对所述音频信息进行语音识别,得到所述音频信息对应的文本信息。
3.根据权利要求1所述的舆情确定方法,其特征在于,所述确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型,包括:
对所述文本信息进行分词处理,得到多个词向量;
在多个所述词向量中提取表征舆情特征的舆情特征词向量,组成舆情特征向量;
基于所述舆情特征向量和预先训练的舆情预测模型,得到所述音视频信息的舆情类型。
4.根据权利要求1所述的舆情确定方法,其特征在于,所述在监管区域的网站平台上获取音视频信息之后,所述方法还包括:
从所述音视频信息中提取音频信息;
对所述音频信息进行声纹识别,得到所述音频信息对应的声纹特征;
基于所述声纹特征和预先存储的声纹特征与用户身份的映射关系,确定所述声纹特征对应的用户身份信息。
5.根据权利要求4所述的舆情确定方法,其特征在于,所述确定所述声纹特征对应的用户身份信息后,所述方法还包括:
若确定所述声纹特征对应的用户身份信息为非法用户,向设定服务器发送该用户身份信息。
6.根据权利要求4所述的舆情确定方法,其特征在于,所述方法还包括:
若基于所述声纹特征和预先存储的声纹特征与用户身份的映射关系,未确定所述声纹特征对应的用户身份信息,将该声纹特征与对应的发布者身份信息进行关联存储。
7.一种舆情确定装置,其特征在于,包括:
获取模块,用于在监管区域的网站平台上获取音视频信息;
处理模块,用于对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息;
第一确定模块,用于确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型。
8.根据权利要求7所述的舆情确定装置,其特征在于,所述处理模块,包括:
音频提取单元,用于从所述音视频信息中提取音频信息;
语音识别单元,用于对所述音频信息进行语音识别,得到所述音频信息对应的文本信息。
9.一种电子设备,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息咨询有限公司,未经厦门快商通信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444007.5/1.html,转载请声明来源钻瓜专利网。