[发明专利]一种微博网络地域突发事件的检测方法有效
| 申请号: | 201710455550.6 | 申请日: | 2017-06-15 |
| 公开(公告)号: | CN107273496B | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 仲兆满;管燕;李存华 | 申请(专利权)人: | 淮海工学院 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9536;G06F40/289;G06Q50/00 |
| 代理公司: | 连云港润知专利代理事务所 32255 | 代理人: | 刘喜莲 |
| 地址: | 222000 江苏省连云港市海*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 地域 突发事件 检测 方法 | ||
本发明公开了一种微博网络地域突发事件的检测方法,其步骤如下:(1)从微博网络中采集地域微博,得到微博集合PLMB,对微博预处理后得到微博集合LMB;(2)从微博集合LMB中提取突发词,得到突发词集合EW;(3)对EW中的突发词进行聚类,得到突发事件词簇EWC={ewc1,ewc2,…,ewcq},假设有q个词簇。本发明方法提出了利用词频率、词关联用户、词分布地域及词社交行为4类指标,计算词的突发值,更合理的利用了微博网络词的突发特征,更适合微博网络地域突发事件的检测。
技术领域
本发明涉及一种信息挖掘技术,具体地说,涉及一种微博网络地域突发事件检测方法。
背景技术
微博作为实时性、交互性很强的社交媒体,为用户提供了自由发表内容以及信息交换的平台,已经成为人们爆料事件、发表观点、分享经验的首选媒体。现实中发生的很多事件在微博上都先有爆料,而后传统的主流媒体才予以报道,比如,2013年的波士顿爆炸事件、撒切尔夫人的离世等等事件。面向微博的事件检测已成为近期事件检测领域的研究热点。
由于微博的很多内容带有地域信息,包括博文提及的地点,发表博文的用户的注册地点,以及博文附带的地理标签等,面向微博的局部地域事件检测(Localized event)已经成为了新兴的研究方向。这类事件检测有一个基本假设,即当本地域没有事件发生的时候,用户很少会讨论此类事件,一旦发生了,就会有大量的讨论,比如地域发生火灾、爆炸、洪水、交通事故、污染、疾病传染等等事件。这与社交媒体的广域事件检测(Global event)有很大的不同,广域事件检测不考虑地域特性,面对的是媒体的整个信息流,不仅分析的工作量大,而且可能忽略了局部地域的热点事件,已有的事件检测方法难以直接应用到地域事件检测之中。
在2010年美国出版的会议论文集:2010年第19届国际万维网会议(19thInternational World Wide Web Conference),题目为:基于Twitter用户的地震检测-通过社交传感器实时检测事件(Earthquake shakes Twitter users:real-time eventdetection by social sensors),作者是Takeshi Sakaki,Makoto Okazaki,YutakaMatsuo,该文把每个Twitter用户模拟成无线传感器网络中的节点,用户发表与地震相关的博文的过程被抽象成无线传感器网络中的节点发布自身采集到的信息行为,再通过博文的时间和空间模型及后续的滤波处理,对地震是否发生进行确认。但该方法需要人工设计一些查询输入项,难以应用到非常规的突发事件的检测。
在2016年中国出版的期刊:现代图书情报技术,题目为:基于地理坐标的微博事件检测与分析,作者是:李进华,安仲杰,该文使用了微博数据的发布数、转发数、评论数、用户活跃度和移动强度5个指标构建微博的特征。该方法在检测微博突发事件时,考虑到的微博类的社交媒体的特征并不全面,包括突发词的频率、地域突发性等,而且在计算各个指标时并没有给出具体的计算方法(包括形式化的公式等等)。
在2016年美国出版的会议论文集:第39届国际ACM信息检索会议(39thInternational ACM SIGIR Conference on Research and Development in InformationRetrieval),题目为:GeoBurst:从地理标签推特流中实时监测区域事件(GeoBurst:Real-Time Local Event Detection in Geo-Tagged Tweet Streams),作者是Zhang Chao,ZhouGuangyu,Yuan Quan,Zhuang Honglei,Zheng Yu,Kaplan Lance,Wang Shaowen,HanJiawei,该文首先在查询窗口内识别一些重要微博作为中心轴点(Pivots),进一步通过与历史数据在时空方面的比较得到突发事件。该方法是从微博文本信息的角度出发,由于微博比较短小,且用语不规范,直接从一些短小的单篇微博文本中难以提取出有效的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮海工学院,未经淮海工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710455550.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浏览器无障碍插件
- 下一篇:一种漏洞信息采集方法和装置





