[发明专利]一种视频场景切换检测方法有效
申请号: | 201711089563.2 | 申请日: | 2017-11-08 |
公开(公告)号: | CN107766838B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 苏许臣;朱立松;黄建杰 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 付秀颖 |
地址: | 214000 江苏省无锡市震*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 场景 切换 检测 方法 | ||
本发明公开了一种视频场景切换检测方法,属于多媒体信息处理技术领域,通过视频场景切换检测模型完成检测,包括视频场景切换检测模型的训练和视频场景切换检测模型的应用。本发明采用深度学习算法,模型的判别阈值由训练过程自动调整到最优,因此,不用设置阈值;由于模型输入增加了两帧的帧差,使得模型收敛速度更快;由于模型采用了batch normalization技术防止训练过拟合,提高了模型的泛化能力。
技术领域
本发明涉及一种视频检测方法,特别是涉及一种视频场景切换检测方法,属于多媒体信息处理技术领域。
背景技术
一个视频一般由多个场景组成,一个场景由多个视频帧组成,视频场景检测是指找出一个视频的发生场景切换的帧和帧位置,得到的位置能用于视频快速和精确剪辑,得到的帧组成的帧序列可以用于粗略描述整个视频内容。
目前,传统的视频场景检测方法一般采用人工提取特征的方式,例如计算相邻帧的颜色直方图相似度,或者直接计算帧差,或者利用视频场景中各帧的高频子带系数的变化程度特征VH检测场景切换,其中计算高频子带系数需要用到三维小波变换等算法,如申请号为200810118534.9的中国专利,这些技术都会计算出一个特征值然后与阈值比较,如果大于阈值或者小于阈值者判定为切换帧。还有一些基于上述技术的自适应阈值算法,如申请号为201410466385.0的中国专利中介绍的基于自适应阈值的视频场景变化检测方法,但是该滑动窗大小以及预设值B还是需要人工设定。
目前,传统的视频场景检测方法都是采用经典的数学算法提取特征,算法的设计比较复杂而且算法的好坏决定了最终的准确率,另外传统的算法避免不了各种阈值的设定,如相似度大小的阈值、滑动窗口的阈值等等,这些阈值的设定需要凭经验获取,阈值的设定好坏也决定了检测准确率的高低。
发明内容
本发明的主要目的是为了提供一种视频场景切换检测方法,将预先准备的大量切换帧对和非切换帧对输入模型进行训练,将待检测视频相邻帧抽取出来依次输入训练好的模型,根据模型的输出找出所有的切换帧位置,无需指定任何阈值,准确率高。
本发明的目的可以通过采用如下技术方案达到:
一种视频场景切换检测方法,通过视频场景切换检测模型完成检测,包括视频场景切换检测模型的训练和视频场景切换检测模型的应用。
进一步的,所述视频场景切换检测模型的训练包括如下步骤:
步骤11:定义视频场景切换检测模型的参数;
步骤12:构建视频场景切换检测模型;
步骤13:定义损失函数,采用交叉熵作为损失函数;
步骤14:定义优化器,采用Adam优化算法;
步骤15:定义评估函数计算视频场景切换检测模型判别准确率;
步骤16:训练和评估视频场景切换检测模型,每训练20次保存一次参数。
进一步的,所述视频场景切换检测模型的应用包括如下步骤:
步骤21:依次读取待检测的视频一帧,并resize到96x96大小;
步骤22:将当前帧及上一帧输入训练好的视频场景切换检测模型,得到视频场景切换检测模型输出结果;
步骤23:如果视频场景切换检测模型输出的结果是切换帧,则输出当前帧序号并保存该帧。
进一步的,所述视频场景切换检测模型包括PAD层、多个卷积组、Reshape层、全连接层512、全连接层2和Softmax层。
进一步的,所述卷积组包括卷积组9×9×32、卷积组3×3×64和卷积组5×5×128。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711089563.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于特征点比对的园林修护系统
- 下一篇:衣架