[发明专利]基于主场景镜头关键帧的体育视频分类方法有效
申请号: | 200910089358.5 | 申请日: | 2009-07-17 |
公开(公告)号: | CN101604325A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 董远;黄煜斌 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主场 镜头 关键 体育 视频 分类 方法 | ||
技术领域
本发明属于多媒体信息处理与检索领域关于体育视频分类的方法,其实质是一种利用镜 头关键帧聚类后提取具有代表性信息的主场景镜头关键帧然后对其做分类的方法,是一种自 动的鲁棒性强的以及运算复杂度低的体育视频处理方法。
背景技术
现今随着计算机技术和互联网技术的发展,触手可及的多媒体信息呈现出爆炸式增长, 而且这种增长越来越迅速,互联网已成为一个浩瀚的海量多媒体信息源。人们可以通过从有 线电视或者IPTV录制体育视频,或者互联网下载,产生大量的视频。这种快速增长的视频 数据催生了许多视频的互联网应用:视频共享网站(如国外的Youtube,国内的优酷,土豆等) 像雨后春笋般的呈现,专门的视频门户网站也是日益增长,这些网站对视频的存储与传播起 到了重要的作用,对海量的视频数据的自动处理也提出了挑战。
体育视频在各类视频中占据重要的分量。体育视频具有实时性,体育赛事每天发生,每 时每刻都有大量的新内容创造出来。用户必然需要以最快的方式得到最新的体育资讯消息, 体育视频能以最大的容量呈现精彩的体育比赛场面和精彩镜头,用户对体育视频的需求也越 来越广泛,越来越迫切。用户观看体育视频的针对性很强,他只关注自己喜欢的那些体育种 类,对其他的体育种类很少甚至根本不关心。所以只有有效的做好体育视频分类,才能使用 户快速的找到自己想要的体育视频。传统的体育视频分类是通过视频文件命名信息或者人工 标注信息来进行分类,这种依赖耗费大量人力的工作显然不再适合现在海量的视频的分类。
为了实现自动的体育视频分类,需要提取体育视频中的反应体育种类的有效信息。体育 视频的内容丰富,有许多信息可以用来表征这个视频的体育种类。然而,其中字幕或者比分 信息由于受到电视转播机构差异性的影响,不同的电视台有不同的字幕表现形式,缺乏通用 的提取方法;所以我们通过提取视频中场景信息来做体育分类。体育镜头大致分为远景、中 景和特写三种。其中最具有代表的是中景镜头,因为远景包括的是场馆内的大体空间信息, 而特写只包含运动员的身体或动作信息,只有中景镜头才完整的保留了该项体育运动中最主 要的最本质的比赛场地信息,如场地颜色,纹理,边缘等。观察体育视频可以知道,中景镜 头是体育视频中最主要的镜头,其出现的时间和次数最多。但是对于一段未知的体育视频, 首先无法得到其先前知识--具有某些特征信息,如篮球的篮筐、足球的球门等,其次不知道 中景镜头的起始和结束点,所以,只能通过无监督学习的方来来提取中景镜头信息。对一个 视频先进行镜头分割,然后选取每一个镜头的关键帧,再提取其鲁棒特征,特征相近的帧聚 到一起成为一类。通过不停的迭代直到聚类结果满足一定的终止条件。这样将所有的关键帧 聚成许多个大类,其中最大的类就是中景镜头,代表这个体育视频。
发明的内容
为了设计一个自动的体育视频分类系统,快速有效的识别体育种类,提高识别率,本发 明提出一个基于镜头关键帧聚类的体育视频分类的方法。该方法首先采用自适应阈值的基于 图理论的聚类方法,提取体育视频的所有属于中景镜头类的关键帧作为主场景,然后通过支 持向量机(SVM)来仅仅对主场景进行分类,而不是视频的每一帧,从而达到自动的决定未知 视频的体育种类,大大减少了计算量。具体来说是先对视频按照进行镜头自动分割,把视频 分成多个片段,每个片段属于一个摄像机镜头拍摄的连续帧,然后在这些帧里边选取关键帧 代表这个片段,再对关键帧提取鲁棒性特征,将其映射到特征空间去,空间中相近的点聚集 到一起,其次在自适应阈值的基于图理论的聚类结果中,选取的属于中景镜头的那类作为主 场景,最后用SVM分类器对主场景进行分类,判断其匹配之前训练好的多个体育模型中的 哪一个。
技术方案如下。
一种基于主场景镜头关键帧的体育视频分类的方法,其特征包括以下步骤:
步骤一,对体育视频进行自动镜头分割,关键帧提取;步骤一具体包括:
对体育视频进行自动镜头分割,把体育视频分成多个片段,每个片段属于一个摄像机镜 头拍摄的连续帧,然后在这些帧里边选取中间时刻点的一帧作为该片段的关键帧代表这个片 段;
步骤二,提取关键帧的鲁棒性特征;
步骤三,基于图理论的自适应阈值聚类算法进行聚类,并选取主场景;步骤三具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910089358.5/2.html,转载请声明来源钻瓜专利网。