[发明专利]一种舆情事件发现方法、装置及计算设备在审
| 申请号: | 202010658727.4 | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111931032A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 李鹏 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
| 主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/332 |
| 代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 舆情 事件 发现 方法 装置 计算 设备 | ||
1.一种舆情事件发现方法,所述方法适于在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置适于存储多个文档内容,每个文档内容关联有浏览次数,所述方法包括步骤:
在一个预定时间长的周期内对所述多个文档内容进行聚类处理,生成至少一个文档类别,其中,每个文档类别下的所有文档内容对应于同一个事件;
基于文档内容关联的浏览次数,获取目标事件对应的浏览次数,所述目标事件为所述至少一个文档类别中任一文档类别所对应的事件;
对目标事件的历史浏览次数进行生长曲线拟合;
当拟合得到的生长曲线的第一特征时间点大于零时,将目标事件识别为舆情事件,且确定所述舆情事件进入爆发期。
2.如权利要求1所述的方法,还包括:
当连续预定数目个周期内,所拟合得到的生长曲线的第二特征时间点均大于预设值时,确定所述舆情事件进入平静期。
3.如权利要求1所述的方法,其中,在所述每隔预定时间对所述多个文档进行聚类处理之前,还包括步骤:
对所述多个文档进行过滤,以去除非负面内容的文档。
4.如权利要求1-3中任一项所述的方法,其中,每个文档类别下的所有文档内容对应于同一个事件,所述文档内容还包括文档标题,所述生成至少一个文档类别后,还包括步骤:
获取每个文档类别下的所有文档内容的关联浏览次数,将关联的浏览次数最高的文档内容的标题作为对应的事件主题名称。
5.如权利要求1-4中任一项所述的方法,其中,所述基于文档内容关联的浏览次数,获取目标事件对应的浏览次数包括步骤:
获取每个文档类别下的所有文档内容的关联浏览次数,相加得到目标事件对应的浏览次数。
6.如权利要求1-5中任一项所述的方法,其中,所述舆情事件进入爆发期指舆情事件从事件刚刚发生,浏览人数从零开始缓慢变化的阶段,进入到为浏览人数快速增长的阶段。
7.如权利要求1-6中任一项所述的方法,其中,所述舆情事件进入平静期指舆情事件从事件爆发后,浏览人数从快速增长的阶段,进入到浏览人数增长缓慢,直至趋近不变的阶段。
8.一种舆情事件发现装置,所述装置与数据存储装置连接,所述数据存储装置适于存储多个文档内容,每个文档内容关联有浏览次数,所述装置包括:
聚类模块,用于在一个预定时间长的周期内对所述多个文档内容进行聚类处理,生成至少一个文档类别,其中,每个文档类别下的所有文档内容对应于同一个事件;
浏览次数获取模块,用于根据文档内容关联的浏览次数,获取目标事件对应的浏览次数,所述目标事件为所述至少一个文档类别中任一文档类别所对应的事件;
生长曲线拟合模块,用于对目标事件的历史浏览次数进行生长曲线拟合;
舆情事件识别模块,用于在拟合得到的生长曲线的第一特征时间点大于零时,将目标事件识别为舆情事件,且确定所述舆情事件进入爆发期。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-7所述的舆情事件发现方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被客户端读取并执行时,使得所述客户端执行如权利要求1-7中任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010658727.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:监控方法、监控系统及计算设备
- 下一篇:一种页面中表格的展示方法及移动终端





