[发明专利]一种基于聚类的镜头关键帧提取方法有效

申请号：	202010534738.1	申请日：	2020-06-12
公开（公告）号：	CN111797707B	公开（公告）日：	2022-03-15
发明（设计）人：	王中元;梁步云;涂卫平;韩镇	申请（专利权）人：	武汉大学
主分类号：	G06V20/40	分类号：	G06V20/40;G06V10/762;G06T5/40;G06T7/90
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	魏波
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于镜头关键提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于聚类的镜头关键帧提取方法，首先针对视频，提取视频帧的HSV颜色直方图作为特征向量；接着对HSV颜色直方图进行聚类，动态生成若干个簇，每个簇中包含镜头的若干个视频帧；然后对规模较小的簇进行合并，某个簇的大小小于预设值，则将该簇合并到其他簇中；最后根据颜色直方图距离或者图像熵选取关键帧。本方法能根据镜头内容的复杂程度自动确定镜头内关键帧的数量，因而选取的关键帧能准确代表镜头内容，且没有冗余。

技术领域

本发明属于视频分析技术领域，涉及一种镜头关键帧提取方法，具体涉及一种基于聚类的镜头关键帧提取方法。

技术背景

新闻视频拆分是将一段长时间、完整的新闻视频拆分成独立的新闻故事单元、镜头以及关键帧。如果用户需要快速浏览或者需要查找到自己关注的新闻片段，就需要提前对新闻视频进行拆分。新闻视频拆分是个性化推送、短视频、视频摘要、智能拆条等应用的基础。

传统的人工视频拆分方式存在诸多缺点。首先，对于视频镜头分割需要浏览完视频的全部内容，整个过程需要消耗大量的时间和人力，处理效率低，难以批量生产；其次，对于视频中关键帧的选取存在很大的主观因素，没有一个选取关键帧的客观标准，不同的人选取出的关键帧可能会不同；最后，拆分的镜头不够准确，有可能出现遗漏和误判。为此，需要一个自动化的新闻视频拆分算法，对新闻视频进行高效精确的处理。

由于镜头中的帧是摄像机连续拍摄得到的，因此，在镜头内相邻帧之间的内容重复度极高。通常而言，只需要阅览镜头中少数的几帧，就可以了解到该镜头表达的核心内容。但是选取体现镜头核心内容的关键帧因视频内容而异，镜头内关键帧的数量由镜头复杂程度决定，当镜头内容越复杂，所取得的关键帧的个数也就越多；反之，当镜头内容基本稳定，即使镜头的时间再长，所提取的关键帧也应该比较少。

聚类算法被广泛应用于视频关键帧提取，基于K-means聚类的关键帧提取是其中的典型代表。尽管K-means算法能够有效的选取出镜头中存在的关键帧，且选出的关键帧具有一定的代表性，但是，由于K是事先设定的值，选取出的关键帧数量无法随着镜头内容复杂程度变化而变化。

发明内容

为了解决传统的K-means聚类方法提取关键帧存在的缺陷，本发明提出了一种改进的基于聚类的镜头关键帧提取方法，能够动态的确定簇的个数，且能合并规模较小的簇，从而提高选出的关键帧的代表性并且降低关键帧的冗余度。

本发明所采用的技术方案是：一种基于聚类的镜头关键帧提取方法，其特征在于，包括以下步骤：

步骤1：针对视频，提取视频帧的HSV颜色直方图作为特征向量；

步骤2：对HSV颜色直方图进行聚类，动态生成若干个簇，每个簇中包含镜头的若干个视频帧；

步骤3：对规模较小的簇进行合并，若某个簇的大小小于预设值，则将该簇合并到其他簇中；

步骤4：根据颜色直方图距离或者图像熵选取关键帧。

本发明具有如下优点和积极效果：

(1)本方法选取的关键帧能准确代表镜头内容，且没有冗余。

(2)能根据镜头内容的复杂程度自动确定镜头内关键帧的数量。镜头内容越复杂，所取得的关键帧的个数也就越多；镜头内容越稳定，即使镜头的时间再长，所提取的关键帧也较少。

附图说明