[发明专利]舆情处理方法、装置及计算机可读存储介质有效
| 申请号: | 201910854619.1 | 申请日: | 2019-09-10 |
| 公开(公告)号: | CN110555092B | 公开(公告)日: | 2023-07-04 |
| 发明(设计)人: | 雷航;洪楷;刘伟;王月瑶;陈乃华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/216 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 舆情 处理 方法 装置 计算机 可读 存储 介质 | ||
本申请实施例提供了一种舆情处理方法、装置及计算机可读存储介质。该方法包括:基于多个热点预定类型舆情确定多个第一关键词以及各个第一关键词针对多个热点预定类型舆情的第一词频,基于预定类型舆情库确定各个第一关键词对应的第二词频,基于至少两个第一关键词对应的第一词频以及第二词频,确定各个第一关键词的得分结果,基于各个第一关键词的得分结果,从多个热点预定类型舆情中确定至少一个目标预定类型舆情。本申请实施例实现了一次性地从多个热点预定类型舆情中提取出至少一个目标预定类型舆情,减少提取过程步骤,提高了提取处理效率,且提取得到的目标预定类型舆情精确性较高,能够反映针对事件的更多信息,提高了提取准确度。
技术领域
本申请涉及舆情处理技术领域,具体而言,本申请涉及一种舆情处理方法、装置及计算机可读存储介质。
背景技术
随着社交网络的发展和积累,舆情的产生以及传播已经融入人们的日常生活中,通常情况下,一个事件的发生会产生大量的舆情,如何对大量的舆情进行处理成为了关键性问题。
目前,针对大量的舆情的处理方式通常是先确定大量的舆情中词频升高的词语,再基于词频升高的词语获取候选短语,然后对候选短语进行聚类处理,从聚类处理后的候选短语中提取目标短语。上述处理方式至少存在两个缺陷,其一,可能针对一个事件存在多个词频升高的词语,针对各个词频升高的词语均需要提取一次目标短语,从而导致提取目标短语的流程较多,工作量较大;其二,提取出的目标短语反映的信息有限,无法反映出事件本身。
因此,有必要提供一种针对大量的舆情的处理方式。
发明内容
本申请提供了一种舆情处理方法、装置及计算机可读存储介质,可以解决以上至少一种技术问题。
第一方面,提供了一种舆情处理方法,该方法包括:
基于多个热点预定类型舆情确定多个第一关键词以及各个第一关键词针对多个热点预定类型舆情的第一词频,多个热点预定类型舆情为从预定类型舆情库中提取得到的;
基于预定类型舆情库确定各个第一关键词对应的第二词频;
基于至少两个第一关键词对应的第一词频以及第二词频,确定各个第一关键词的得分结果;
基于各个第一关键词的得分结果,从多个热点预定类型舆情中确定至少一个目标预定类型舆情。
在另一个可能的实现方式中,基于多个热点预定类型舆情确定多个第一关键词以及各个第一关键词针对多个热点预定类型舆情的第一词频,包括:
基于多个热点预定类型舆情确定多个关键词,并确定各个关键词的词向量;
基于各个关键词的词向量对多个关键词进行分类,得到多个关键词类别;
确定各个关键词类别分别对应的第一关键词及各个第一关键词针对多个热点预定类型舆情的第一词频。
在另一个可能的实现方式中,基于多个热点预定类型舆情确定多个关键词,包括以下至少一项:
对多个热点预定类型舆情进行分词,基于分词结果确定多个关键词;
对多个热点预定类型舆情进行分词,并对分词结果进行组合,基于组合后的分词结果确定多个关键词。
在另一个可能的实现方式中,确定任一关键词类别对应的第一关键词及第一关键词针对多个热点预定类型舆情的第一词频,包括:
基于预定类型舆情库确定任一关键词类别中各个关键词对应的词频;
从各个关键词对应的词频中确定词频最大值对应的第一关键词;
针对多个热点预定类型舆情,将任一关键词类别对应的各个关键词替换为第一关键词,得到替换后的多个热点预定类型舆情;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910854619.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于词向量的联想词生成方法及装置
- 下一篇:文本匹配方法、装置及设备





