[发明专利]舆情确定方法、装置、设备及存储介质在审
申请号: | 201910444007.5 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110287315A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 张广学;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤;王静 | 申请(专利权)人: | 厦门快商通信息咨询有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音视频信息 存储介质 特征向量 网站平台 文本信息 监管区域 网络舆情 有效识别 监测 申请 | ||
本申请公开了一种舆情确定方法、装置、设备及存储介质,在监管区域的网站平台上获取音视频信息,对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息,确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型,从而在网络舆情监测时,增加对音视频信息对应的舆情类型进行有效识别,增加舆情判断的准确性。
技术领域
本申请涉及计算机技术领域,特别涉及一种舆情确定方法、装置、设备及存储介质。
背景技术
舆情是指在出现特定事件时,民众所持的社会态度。近年来,随着互联网技术的发展,网络资源处于高度的共享之中,因此,网络中出现的舆情,传播范围之广,受众面积之大,往往对企业的经营状况造成影响。
网络舆情监控是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的一个过程。网络舆情不仅有着巨大的商业价值,可作为企业用来营销的依据,同时也涉及到政治与社会。
目前对网络舆情的监控主要是针对文字内容,进行采集、清洗、加工、展示等处理,随着智能移动设备与移动互联网的快速发展,其相应的互联网内容也在发生变化。比如互联网上的内容不再是单纯的文字内容,而是图片、声音、视频等内容,并且越来越多,传统的网络舆情采集方法无法识别这部分内容,不利于网络舆情的监控。
发明内容
本申请的目的在于提供一种舆情确定方法、装置、设备及存储介质,以克服现有技术因无法对音视频信息进行识别而造成的无法对网络舆情进行监控的技术问题。
第一方面,本申请提供了一种舆情确定方法,包括:
在监管区域的网站平台上获取音视频信息;
对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息;
确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述对获取到的音视频信息进行处理,得到所述音视频信息对应的文本信息,包括:
从所述音视频信息中提取音频信息;
对所述音频信息进行语音识别,得到所述音频信息对应的文本信息。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述确定所述文本信息对应的舆情特征向量,并基于所述舆情特征向量确定所述网站平台的音视频信息的舆情类型,包括:
对所述文本信息进行分词处理,得到多个词向量;
在多个所述词向量中提取表征舆情特征的舆情特征词向量,组成舆情特征向量;
基于所述舆情特征向量和预先训练的舆情预测模型,得到所述音视频信息的舆情类型。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述在监管区域的网站平台上获取音视频信息之后,所述方法还包括:
从所述音视频信息中提取音频信息;
对所述音频信息进行声纹识别,得到所述音频信息对应的声纹特征;
基于所述声纹特征和预先存储的声纹特征与用户身份的映射关系,确定所述声纹特征对应的用户身份信息。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,所述确定所述声纹特征对应的用户身份信息后,所述方法还包括:
若确定所述声纹特征对应的用户身份信息为非法用户,向设定服务器发送该用户身份信息。
在一种可能的实现方式中,在本申请实施例提供的上述方法中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息咨询有限公司,未经厦门快商通信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444007.5/2.html,转载请声明来源钻瓜专利网。