[发明专利]一种基于TextTiling的镜头边界检测方法在审
| 申请号: | 201710434123.X | 申请日: | 2017-06-09 |
| 公开(公告)号: | CN107424163A | 公开(公告)日: | 2017-12-01 |
| 发明(设计)人: | 贾西平;谢彬彬;陈荣军;柏柯嘉;廖秀秀;欧阳佳;刘少鹏;张倩 | 申请(专利权)人: | 广东技术师范学院 |
| 主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/136;G06T7/90 |
| 代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
| 地址: | 510665 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 texttiling 镜头 边界 检测 方法 | ||
技术领域
本发明涉及视频镜头边界检测领域,更具体地,涉及一种基于TextTiling的镜头边界检测方法。
背景技术
视频镜头边界检测是基于内容的视频检索中的首要工作,也是关键技术之一。近年来,国内外相关领域的众多学者做了大量富有成效的工作,典型的算法有如下几种:
(1)基于边缘的算法
基于边缘的算法的基本思想是镜头发生变化,镜头内物体的边缘也相应改变,因此可以根据边缘的变化来检测镜头边界。Zabih等人提出了基于边缘的场景分割算法,该算法利用Canny算法提取帧的边缘特征来计算相邻帧的边缘变化,通过合适的阈值来判断边缘的变化是否引起镜头的变化。同时利用全局运动计算来判断是镜头运动还是物体移动。
该算法对于边缘变化清晰、简单的视频帧,该算法能达到较好的效果。但是,当帧的边缘复杂时,则容易造成误检,并且计算量较大。
(2)基于颜色直方图的算法
颜色直方图是对图像中的像素颜色分布的量化表示。其中Zhang等人提出的双阈值比较算法(Twin-comparison Algorithm)是典型的基于直方图的算法,该算法利用颜色直方图提取视频帧的特征,采用较大阈值检测连续帧间差中的突变镜头,采用较小阈值以及一系列帧间的累积差值检测渐变镜头,应用运动分析来过滤包含全局或者大范围运动的帧以避免镜头误检。
基于直方图的算法只考虑颜色的变化,较容易实现,且效果较为稳定,但是没有考虑镜头运动等因素,容易造成镜头的误检。
(3)自适应阈值选择的算法
现有的一种自动阈值的镜头检测算法,该算法在双阈值比较法的基础上使用一趟视频扫描,通过比较连续帧之间的帧差来检测突变镜头,通过比较一系列帧之间的累积差值来检测渐变。同时根据滑动窗口中的帧间颜色直方图差值是否满足分布差异来动态计算阈值,如公式(1)所示。
mmax-mmin>(Factor*mean)(1)
其中,mean表示窗口内帧间颜色直方图差值的平均值,Factor为常数系数,mmax和mmin分别表示以窗口内帧间颜色直方图差值的最大值和最小值的中值为分界点,将窗口内帧间颜色直方图差值划分为较小值和较高值两个集合的对应平均值。
然而,该算法在滑动窗口中的相邻帧间差同时出现多个较大的值时,会提高窗口内的相邻帧间差的平均值,从而不满足帧间颜色直方图分布差异,较容易造成镜头边界的漏检。
(4)其他算法
秦剑鹏等人提出用颜色直方图变化率HCR(Histogram Change Ratio)来反映镜头内部图像帧序列的颜色变化,并在此基础上来对镜头进行分割。巢娟等人提出基于自适应双重检测模型的视频镜头分割算法,结合滑动窗口自适应二分查找算法进行镜头边界初检,复检过程利用SIFT算法对初检得到的镜头边界进行匹配确认。方勇等人则提出了结合相邻帧差与邻域窗帧差的镜头边界系数模型,认为镜头边界处的邻域窗帧差之间的相对比例关系是确定的,从而利用该特点来检测镜头。还有研究人员提出基于互信息量的镜头边界检测算法,采用基于HSV空间不均匀分块直方图求取的帧间互信息量作为视频帧间差异度量,结合相应的阈值策略与时域窗策略,实现对镜头边界的检测。
Sahouria等人利用主成分分析(PCA)来降低视频帧中提取特征的维度,但该算法不能检测具体的视频边界,而是用于发现高维的视频场景。胡双演等人提出了基于SVD的镜头边界检测算法,经过SVD变换得到视频帧的特征值矩阵,然后将特征值矩阵投影到低维的向量空间,通过分析向量间的夹角来判断镜头的变化。朱庆生等人提出了用增量主成分分析(IPCA)对视频进行实时分析和在线镜头分割,通过每检测到b个镜头边界时,就重新开始初始化特征空间矩阵,避免IPCA允许样本逐步输入而造成需要存储空间逐步增大的问题。然后通过比较残余向量的模是否大于给定的阈值来检测镜头边界。
发明内容
本发明为克服上述现有技术所述的至少一种不足,提供一种基于TextTiling的镜头边界检测方法。本方法采用主成分分析法提取视频帧的特征,采取以滑动窗口为单位,将每个窗口内的帧投影到各自窗口构成的特征子空间,再计算相邻帧间距离及潜在边界的深度值以识别视频镜头边界。
为解决上述技术问题,本发明的技术方案如下:
一种基于TextTiling的镜头边界检测方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范学院,未经广东技术师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710434123.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像分割方法及系统
- 下一篇:一种毛孔定位识别的方法和装置





