[发明专利]一种情感激励下的视频关键帧自适应提取方法有效
申请号: | 201410248555.8 | 申请日: | 2014-06-06 |
公开(公告)号: | CN104008175B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 余春艳;翁子林;苏晨涵;叶东毅;陈昭炯 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06T7/20 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 激励 视频 关键 自适应 提取 方法 | ||
技术领域
本发明涉及视频图像处理领域,特别是一种情感激励下的视频关键帧自适应提取方法。
背景技术
近年来多媒体技术的发展以及便携视频设备的普及催生出越来越多的视频数据,如何对这些数据进行快速浏览与高效管理成为一个亟待解决的问题。人的时间精力与视频的增长速度不成正比。一方面,人的时间跟精力是有限的,无法全部浏览自己感兴趣的视频;另一方面,视频数量不断暴涨。比如,对于体育视频爱好者来说,由于各方面的因素他们无法浏览一段时间内的全部比赛视频。事实上,他们可能只关注每场比赛的一些关键瞬间。为节省时间,需要对视频内容进行一定的分析,提取出其中的视频关键帧让用户尽可能快速地了解整段视频。
视频关键帧提取技术为用户能够快速了解视频片段提供了可能,为视频摘要以及视频检索提供了技术支撑。由于视频关键帧最终将服务于用户,因此如何充分考虑视频观看者情感变化以及视频的情感语义变化情况,从视频情感语义上更好地指导视频关键帧提取成为目前研究的重点问题之一。
传统的视频关键帧提取方法主要基于低层物理特征进行分析,没有从高层情感语义的角度分析问题。视频关键帧的一个很重要的特性在于它一般要服务于用户,没有从视频观看者的角度思考问题,没有从情感语义上定位视频关键帧往往导致所提取的视频关键帧缺乏一定的价值性和代表性。这类方法大多基于聚类或者基于运动分析。因此,目前本领域相关技术人员需要解决的技术问题在于:如何考虑视频观看者情感变化以及视频的情感语义变化情况,从视频情感语义上指导视频关键帧提取,使提取出来的视频关键帧更具有代表性和有效性。
发明内容
本发明的目的在于提供一种情感激励下的视频关键帧自适应提取方法,使得在视频情感语义的指导下所提取的视频关键帧更具有代表性和有效性,并且实现镜头关键帧数目的合理分配。
为实现上述目的,本发明的技术方案是:一种情感激励下的视频关键帧自适应提取方法,包括如下步骤,
步骤S1:从视频镜头中提取出所有视频帧并计算每个视频帧的视觉情感激励度 ;
步骤S2:计算与步骤S1中每个视频帧同步的音频数据的听觉情感激励度;
步骤S3:通过线性加权的方式将视觉情感激励度与听觉情感激励度融合,二者权重相等,得出每个视频帧的视频情感激励度,最后根据各镜头的视频情感激励情况自适应地计算出镜头的视频关键帧数目KN;
步骤S4:根据镜头内所有视频帧的视频情感激励度得到镜头的视频情感激励度曲线,在镜头的视频情感激励度曲线中选取视频情感激励度最高的前KN个波峰所对应的视频帧作为镜头的视频关键帧。
在本发明实施例中,所述步骤S1所述视频帧的视觉情感激励度的提取,是根据视频帧的运动强度按照以下方案实现:
步骤S11:用横向R-1、纵向C-1条平行线把每个视频帧分成R·C个子块,其中,R、C为自然数,且R>1,C>1;
步骤S12:计算当前视频帧与相邻的前一帧在对应像素点的像素差绝对值,根据像素差值绝对值计算当前帧在该像素点的运动强度;用表示像素点(i,j)的运动强度,若像素差值绝对值大于阈值,则认为该像素点发生运动,将置为1,反之为0;
步骤S13:根据所述子块内发生运动的像素比例来计算子块的运动强度;用表示当前帧在第i个子块的运动强度,子块内发生运动的像素点比例超过阈值就认为该子块发生运动,将该子块的运动强度置为1,反之为0;
步骤S14:根据当前视频帧发生运动的子块数占所有子块数的比例来计算视频帧的运动强度,即视觉情感激励度。
在本发明实施例中,所述步骤S2所述视频帧的同步音频数据的听觉情感激励度的提取,是根据音频帧的短时平均能量和音调按照以下方案计算得到:
步骤S21:将所述视频帧的同步音频数据进行音频分帧处理,音频帧之间有50%重叠,得到AN个音频帧;
步骤S22:计算每个音频帧的短时能量Energy,取AN个音频帧的平均短时能量作为所述视频帧所对应的声音能量情感激励度;
步骤S23:计算每个音频帧的音调Pitch,取AN个音频帧的平均音调作为所述视频帧所对应的音调情感激励度;
步骤S24:所述视频帧的同步音频数据的听觉情感激励度由以及相加得到,即。
在本发明实施例中,所述步骤S3所述的镜头视频关键帧数目KN的自适应计算方法按照以下方案实现:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410248555.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种爬虫系统及其方法
- 下一篇:一种LED封装结构