[发明专利]一种网络视频事件挖掘方法及系统在审
申请号: | 201610324088.1 | 申请日: | 2016-05-16 |
公开(公告)号: | CN107391510A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 张承德 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;中南财经政法大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 郝传鑫,熊永强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 视频 事件 挖掘 方法 系统 | ||
技术领域
本发明涉及计算机领域,尤其涉及一种网络视频事件挖掘方法及系统。
背景技术
随着互联网技术的迅猛发展和计算机的普及,普通用户越来越容易从谷歌、百度、YouTube和优酷等视频分享网站上获得大量正在发生的事件的网络视频。另外,大量新闻媒体也越来越多的将大量网络视频放到他们的网站。这对普通用户能否快速从搜索引擎返回的海量网络视频中,掌握主要事件是一个挑战。网络视频事件挖掘是一个非常有意义的研究课题。
现有技术的网络视频事件挖掘包括三个部分:视频部分、文本部分以及通过视频和文本信息融合进行事件挖掘。视频部分,相似关键帧检测采用标准相似关键帧检测方法,并提取视觉特征;文本部分,通常针对独立的单词提取特征或采用标准的关联规则方法提取特征;视频和文本信息融合部分,通过文本和视频信息的融合弥补各自的缺陷实现更好的事件分类的目的。
这种网络视频事件挖掘框架,在文本和视觉特征融合过程中,充分利用了文本的语义信息和视觉的视频内容信息间的关系,有效提高了事件挖掘的有效性。但是另一方面,由于语义信息的使用,使得文本信息中的噪声信息很容易扩散到视觉信息甚至起到误导的作用,从而降低了事件挖掘的效果。
发明内容
本发明实施例所要解决的技术问题在于,提供一种网络视频事件挖掘方法及网络视频事件挖掘系统,能够更好的进行文本和视觉信息的融合,解决现有技术中文本信息中的噪声信息很容易扩散到视觉信息甚至起到误导的作用,从而降低了事件挖掘的效果的技术问题。
为了解决上述技术问题,本发明实施例第一方面公开了一种网络视频事件挖掘方法,包括
从至少两个类型的多媒体信息中获取视觉信息和文本信息;
对所述视觉信息和所述文本信息进行突发性特征挖掘,分别得到视觉突发特征信息和文本突发特征信息;
分别计算每个文本突发特征信息在所有各个视觉突发特征信息中的分布权重;
根据所述分布权重,通过多重对应分析模型进行训练测试,挖掘出网络视频事件。
结合第一方面,在第一种可能的实现方式中,通过以下公式计算每个文本突发特征信息在所有各个视觉突发特征信息中的分布权重:
其中,所述为第i个文本突发特征信息在第j个视觉突发特征信息中分布权重;所述F(i,j)为所述第i个文本突发特征信息在所述第j个视觉突发特征信息中出现的频率;所述∑N(j)为所述第j个视觉突发特征信息中出现的所有文本突发特征信息的频率;所述D(Gi)为包含所述第i个文本突发特征信息的视觉突发特征信息的数量;所述N为视觉突发特征信息的数量。
结合第一方面,在第二种可能的实现方式中,所述对所述视觉信息和所述文本信息进行突发性特征挖掘,包括通过特征轨迹挖掘,频繁模式挖掘、关联规则挖掘中的任意组合的挖掘方式进行突发性特征挖掘;其中,
所述特征轨迹挖掘、所述频繁模式挖掘对所述视觉信息和所述文本信息都进行挖掘;所述关联规则挖掘对所述文本信息进行挖掘。
结合第一方面,在第三种可能的实现方式中,所述根据所述分布权重,通过多重对应分析模型进行训练测试,挖掘出网络视频事件,包括:
对所述分布权重进行离散化处理,得到特征值对;并计算所述特征值对与网络视频事件的第一相似度;
根据所述分布权重和所述第一相似度,计算所述视觉突发特征信息与网络视频事件的第二相似度;
根据所述第二相似度挖掘出网络视频事件。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述计算所述特征值对与网络视频事件的第一相似度,包括:
将所述特征值对与网络视频事件映射到多维空间;
在所述多维空间中通过计算所述特征值对与所述网络视频事件的夹角,分析所述特征值对与所有网络视频事件的相关性,得到第一相似度。
结合第一方面,或者第一方面的第一种可能的实现方式,或者第一方面的第二种可能的实现方式,或者第一方面的第三种可能的实现方式,或者第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述挖掘出网络视频事件之后,还包括:
对挖掘出的网络视频事件进行事件间关系紧密度程度测量,得出各个网络视频事件的事件间关系紧密度程度信息。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;中南财经政法大学,未经腾讯科技(深圳)有限公司;中南财经政法大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610324088.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:标签推荐方法及装置
- 下一篇:一种信息推送方法和装置