[发明专利]一种舆情分析方法及装置有效
申请号: | 202011088645.7 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112214673B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 王云云;高洁;张涛 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 舆情 分析 方法 装置 | ||
本申请实施例提供一种舆情分析方法及装置,涉及通信技术领域,解决了现有技术中舆情分析结果的准确率较低的技术问题。该舆情分析方法包括:获取预设监测期内网络用户生成的与舆情分析主题相关的多条搜索数据,每条搜索数据包括用户标识、搜索时间以及搜索字段;分别将每个用户标识对应的搜索字段中搜索时间的时间间隔小于第一阈值的搜索字段进行去重处理,得到第一搜索数据;从第一搜索数据中获取预设数量的第二搜索数据,该第二搜索数据的搜索时间晚于该第一搜索数据中除第二搜索数据之外的其他搜索数据的搜索时间;将预设数量的第二搜索数据输入到舆情分析模型得到该舆情分析主题的舆情方向。
技术领域
本申请涉及通信技术领域,尤其涉及一种舆情分析方法及装置。
背景技术
舆情是指网络用户针对社会中的各种现象所表达的态度、意见和情绪等。如果引导不善,负面的网络舆情可能会对社会公共安全造成威胁,因此,分析舆情方向对于维护社会稳定至关重要。
现有技术可以爬取网页中的舆情数据,该舆情数据可以为用户输入的搜索词,并根据这些数据中正面舆情数据和负面舆情数据的比例确定舆情的方向。然而,爬取到的数据可能并不能真实的反映舆情方向,例如,同一用户可能会对同一事件进行重复搜索,且用户的态度也可能会发生变化,因此,根据舆情数据的比例判断舆情方向会使舆情分析结果的准确率较低。
发明内容
本申请提供一种舆情分析方法及装置,解决了现有技术中舆情分析结果的准确率较低的技术问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供一种舆情分析方法,包括:获取预设监测期内网络用户生成的与舆情分析主题相关的多条搜索数据,每条搜索数据包括用户标识、搜索时间以及搜索字段;分别将每个用户标识对应的搜索字段中搜索时间的时间间隔小于第一阈值的搜索字段进行去重处理,得到第一搜索数据;从第一搜索数据中获取预设数量的第二搜索数据,该第二搜索数据的搜索时间晚于该第一搜索数据中除第二搜索数据之外的其他搜索数据的搜索时间;将预设数量的第二搜索数据输入到舆情分析模型得到该舆情分析主题的舆情方向。
本申请实施例中,由于每条搜索数据包括用户标识、搜索时间以及搜索字段,因此,一方面,通过将每个用户标识对应的搜索字段按照搜索时间的时间间隔进行去重处理可以避免同一用户因为网络延迟、卡顿等原因在短时间内进行重复搜索造成的数据重复问题,从而提高舆情分析结果的准确率;另一方面,由于同一个用户标识对应的不同搜索字段中,越接近当前时间的搜索字段对分析结果的影响越大,因此,通过从第一搜索数据中获取第二搜索数据,并将第二搜索数据作为舆论分析模型的输入样本可以使分析结果更加准确的表现出用户的舆论方向;再一方面,由于输入样本中每个用户对应的第二搜索数据的数量都为预设数量,因此,每个用户对分析结果的权重都相同,从而可以平均每个用户对分析结果的影响,进而可以提高舆情分析结果的准确率。
第二方面,提供一种舆情分析装置,包括:获取单元、处理单元、确定单元以及分析单元;该获取单元,用于获取预设监测期内网络用户生成的与舆情分析主题相关的多条搜索数据,每条搜索数据包括用户标识、搜索时间以及搜索字段;该处理单元,用于分别将每个用户标识对应的搜索字段中搜索时间的时间间隔小于第一阈值的搜索字段进行去重处理,得到第一搜索数据;该确定单元,用于从该第一搜索数据中确定预设数量的第二搜索数据,该第二搜索数据的搜索时间晚于该第一搜索数据中除该第二搜索数据之外的其他搜索数据的搜索时间;该分析单元,用于将所有用户标识对应的该预设数量的第二搜索数据输入到舆情分析模型得到该舆情分析主题的舆情方向。
第三方面,提供一种舆情分析装置,包括存储器和处理器。存储器用于存储计算机执行指令,处理器与存储器通过总线连接。当舆情分析装置运行时,处理器执行存储器存储的计算机执行指令,以使舆情分析装置执行第一方面提供的舆情分析方法。
第四方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得该计算机执行第一方面提供的舆情分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011088645.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据安全加密管理模块
- 下一篇:一种车载智能防盗监控仪