[发明专利]一种基于颜色相似度的视频场景分割方法有效
申请号: | 201210273694.7 | 申请日: | 2012-08-01 |
公开(公告)号: | CN102833492A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 张怡;任金昌;袁正雄;温超 | 申请(专利权)人: | 天津大学 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N5/14 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 颜色 相似 视频 场景 分割 方法 | ||
所属技术领域
本发明属于计算机视频数据处理技术领域,特别涉及一种视频场景分割的方法。
背景技术
近年来随着数字多媒体技术以及计算机存储能力的快速发展,数字视频在人们工作和生活中获得了广泛应用。然而,如何对大量的数字视频数据进行有效的检索与管理则是现阶段需要解决的难题。视频场景分割作为关键性的基础步骤,在解决这个问题上显得尤为重要。显然,把一个完整的视频分割成若干具有显著独立内容的片段集合对完整视频的摘要提取和内容检索具有重要作用。
发明内容
本发明的目的在于提供一种简单有效的视频场景分割方法。本发明提出的视频分割方法,仅使用了视频中各帧图像的颜色特征,且对于视频片段间的骤变分割点和过渡片段的提取都有比较好的效果。为此,本发明采用如下的技术方案:
一种基于颜色相似度的视频场景分割方法,该方法对于一个视频片段,按照下列方法得到相似度矩阵:所有帧的RGB颜色直方图,利用直方图计算帧之间的相似度,获得整个片段范围的相似度矩阵,并且,规定了一个场景过渡到另一个场景的场景变化形式的分类:
(1)骤变分割点:从一个场景直接转向另一个场景,中间没有过渡;
(2)淡入淡出的过渡段:从一个场景转向另一个场景的过程中,前一个场景淡出的同时,后一个场景淡入;
(3)复杂的过渡段:不能划分到上述两种情况的其他场景变化形式;
该方法包括下列的步骤:
步骤一按照以下方法进行视频片段的首次场景分割:
(1)把第一帧纳入第一个场景,以第二帧作为当前帧;
(2)计算当前帧的前一个场景的相似度矩阵所有值的平均值avg0,以及它与前一个场景所有帧的相似度向量的平均值avg1;
(3)若|avg0-avg1|<一致性阈值TH1,则把当前帧纳入前一个场景,将当前帧的下帧作为当前帧,继续(2);否则,以当前帧为起点,开始新的场景,将当前帧的下帧作为当前帧,并继续(2),直到视频片段终止,从而得到分割结果;
步骤二合并小场景:在分割结果中,合并若干个连续的帧数小于合并阈值TH2的场景;
步骤三验证过渡段并再分割:计算合并而成的场景范围内相似度矩阵所有值的标准差,若标准差小于过渡段判别阈值TH3,则该合并后的场景被判定为伪过渡段,还原为合并前的小场景状态;否则,判定该场景为过渡段,保持合并后的状态,至此获得新的分割结果。
作为优选实施方式,其中的三个阈值的训练按照下列步骤进行:
(1)获取一批用于训练的视频片段,对该批视频片段的每个真实场景分割点进行从一个场景过渡到另一个场景的场景变化形式的分类:
(2)设定一致性阈值TH1的初始值与终止值以及渐增的单位步长,并设定初始的合并阈值TH2和过渡段判别阈值TH3;
(3)对每个用于训练的视频片段,按照步骤一中的方法进行首次场景分割,得到分割结果;
(4)将分割结果与视频片段的各个真实场景分割点进行比对:用分割结果比对真实场景分割点计算代价值a和覆盖率b,并以评价分割与真实场景分割点的吻合程度,其中,代价值a的计算如下:
a初始为0;对分割结果的每一分割处的帧,在真实场景分割点中寻找它,若能够在真实场景分割点中找到,且该处为骤变分割点,则不对a做任何操作;若能够在真实场景分割点中找到,且处于淡入淡出的过渡段或复杂过渡段内,则
若无法找到,则a=a+1;
覆盖率b的计算如下:
引入变量a1,a1初始为0;对真实场景分割点每一分割处的帧,在分割结果中寻找它,若能够在分割结果中找到,则不对a1做任何操作,若无法找到,则a1=a1+1;最后计算
(5)不断变化TH1的值使得最小,得到用于训练的视频片段的TH1训练值;
(6)取所有用于训练的视频片段的TH1训练值的平均值作为一致性阈值的建议值;
(7)以上述训练得到的一致性阈值的建议值为TH1,再按照步骤一的方法进行首次场景分割;
(8)设定合并阈值TH2的初始值与终止值及渐增的单位步长;
(9)把若干个连续的帧数均小于TH2的场景合并为一个场景;
(10)按照步骤(4)的方法将合并小场景得到的结果与视频片段的真实场景分割点进行比对;
(11)不断变化TH2的值使得最小,得到用于训练的视频片段的TH2训练值;
(12)取所有用于训练的视频片段的TH2训练值的平均值作为合并阈值的建议值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210273694.7/2.html,转载请声明来源钻瓜专利网。