[发明专利]面向事件检测的多策略媒体数据流过滤方法及其装置有效
申请号: | 201810645129.6 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108959484B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 陈刚;唐永旺;魏晗;席耀一;郭志刚;袁江林 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向事件检测的多策略媒体数据流过滤方法及其装置,该方法包含:离线阶段,根据收集到的媒体用户数据,构建垃圾用户数据库和应用来源黑名单列表;在线识别阶段,针对媒体数据流,通过垃圾用户数据库和应用来源黑名单列表进行媒体数据过滤,通过媒体内容及上下文特征过滤非事件媒体数据,并对媒体数据进行在线聚类,识别事件类簇,对事件类簇中的媒体数据进行净化。本发明有效解决微博数据流中噪声数据和其它非事件数据对微博事件检测的影响,能够清理微博数据流中的绝大部分非事件微博,有效提高微博事件检测性能,实时性、实用性强,便于及时提取热点话题和突发事件,对新媒体数据流处理技术具有重要的指导意义。 | ||
搜索关键词: | 面向 事件 检测 策略 媒体 数据流 过滤 方法 及其 装置 | ||
【主权项】:
1.一种面向事件检测的多策略媒体数据流过滤方法,其特征在于,包含如下内容:离线阶段,根据收集到的媒体用户数据,构建垃圾用户数据库和应用来源黑名单列表;在线识别阶段,针对媒体数据流,通过垃圾用户数据库和应用来源黑名单列表进行媒体数据过滤,通过媒体内容及上下文特征过滤非事件媒体数据,并对媒体数据进行在线聚类,识别事件类簇,对事件类簇中的媒体数据进行净化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810645129.6/,转载请声明来源钻瓜专利网。