[发明专利]一种基于聚类的镜头关键帧提取方法有效
申请号: | 202010534738.1 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111797707B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 王中元;梁步云;涂卫平;韩镇 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/762;G06T5/40;G06T7/90 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 镜头 关键 提取 方法 | ||
本发明公开了一种基于聚类的镜头关键帧提取方法,首先针对视频,提取视频帧的HSV颜色直方图作为特征向量;接着对HSV颜色直方图进行聚类,动态生成若干个簇,每个簇中包含镜头的若干个视频帧;然后对规模较小的簇进行合并,某个簇的大小小于预设值,则将该簇合并到其他簇中;最后根据颜色直方图距离或者图像熵选取关键帧。本方法能根据镜头内容的复杂程度自动确定镜头内关键帧的数量,因而选取的关键帧能准确代表镜头内容,且没有冗余。
技术领域
本发明属于视频分析技术领域,涉及一种镜头关键帧提取方法,具体涉及一种基于聚类的镜头关键帧提取方法。
技术背景
新闻视频拆分是将一段长时间、完整的新闻视频拆分成独立的新闻故事单元、镜头以及关键帧。如果用户需要快速浏览或者需要查找到自己关注的新闻片段,就需要提前对新闻视频进行拆分。新闻视频拆分是个性化推送、短视频、视频摘要、智能拆条等应用的基础。
传统的人工视频拆分方式存在诸多缺点。首先,对于视频镜头分割需要浏览完视频的全部内容,整个过程需要消耗大量的时间和人力,处理效率低,难以批量生产;其次,对于视频中关键帧的选取存在很大的主观因素,没有一个选取关键帧的客观标准,不同的人选取出的关键帧可能会不同;最后,拆分的镜头不够准确,有可能出现遗漏和误判。为此,需要一个自动化的新闻视频拆分算法,对新闻视频进行高效精确的处理。
由于镜头中的帧是摄像机连续拍摄得到的,因此,在镜头内相邻帧之间的内容重复度极高。通常而言,只需要阅览镜头中少数的几帧,就可以了解到该镜头表达的核心内容。但是选取体现镜头核心内容的关键帧因视频内容而异,镜头内关键帧的数量由镜头复杂程度决定,当镜头内容越复杂,所取得的关键帧的个数也就越多;反之,当镜头内容基本稳定,即使镜头的时间再长,所提取的关键帧也应该比较少。
聚类算法被广泛应用于视频关键帧提取,基于K-means聚类的关键帧提取是其中的典型代表。尽管K-means算法能够有效的选取出镜头中存在的关键帧,且选出的关键帧具有一定的代表性,但是,由于K是事先设定的值,选取出的关键帧数量无法随着镜头内容复杂程度变化而变化。
发明内容
为了解决传统的K-means聚类方法提取关键帧存在的缺陷,本发明提出了一种改进的基于聚类的镜头关键帧提取方法,能够动态的确定簇的个数,且能合并规模较小的簇,从而提高选出的关键帧的代表性并且降低关键帧的冗余度。
本发明所采用的技术方案是:一种基于聚类的镜头关键帧提取方法,其特征在于,包括以下步骤:
步骤1:针对视频,提取视频帧的HSV颜色直方图作为特征向量;
步骤2:对HSV颜色直方图进行聚类,动态生成若干个簇,每个簇中包含镜头的若干个视频帧;
步骤3:对规模较小的簇进行合并,若某个簇的大小小于预设值,则将该簇合并到其他簇中;
步骤4:根据颜色直方图距离或者图像熵选取关键帧。
本发明具有如下优点和积极效果:
(1)本方法选取的关键帧能准确代表镜头内容,且没有冗余。
(2)能根据镜头内容的复杂程度自动确定镜头内关键帧的数量。镜头内容越复杂,所取得的关键帧的个数也就越多;镜头内容越稳定,即使镜头的时间再长,所提取的关键帧也较少。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的《新闻三十分》片段中提取关键帧的比较示意图;
图3为本发明实施例的《新闻联播》片段中提取关键帧的比较示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534738.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:换挡控制方法、系统及车辆
- 下一篇:一种阻燃抗紫外线无纺地毯及其制备方法