[发明专利]一种视频聚类切分方法和系统有效
申请号: | 202010165676.1 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111428590B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 李琎;侯文超;陈凌云;柴中进 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/762;G06V10/82;G06V10/74;G06N3/0464 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 切分 方法 系统 | ||
1.一种视频聚类切分方法,其特征在于,包括如下步骤:
切分视频,以获取视频粗镜头集;
计算粗镜头关键帧的特征向量,根据特征向量计算粗镜头中关键帧之间的相似度信息;
根据相似度信息将粗镜头进行聚类,并计算粗镜头的密度值和不同聚类的距离值;
设定一密度阈值和距离阈值,根据所述密度阈值和距离阈值筛选粗镜头,并赋予聚类标签;
将同一聚类标签并时间相邻的粗镜头合并,并切分对应的边缘帧;
切分视频的步骤中包括:对视频每一帧建立直方图,计算相邻两帧直方图之间的差异,设定差异阈值,相邻两帧直方图之间的差异大于所述差异阈值时,则切分该两帧之间的图像;
在上述相似度信息获取的步骤中包括:
采用Resnet18网络作为图像特征提取器提取粗镜头中关键帧帧图像的特征信息,并以所述Resnet18网络的倒数第二层输出;
定义ρi为密度值,所述密度值ρi的计算方法包括如下步骤:
设定一截断距离dc,粗镜头集合为xi为粗镜头集合S中任意一镜头关键帧的特征向量,IS={1,2,…,N}为相应的指标集,定义dij=dist(xi,xj)为S集合中任意关键帧的相似度,密度值的计算公式为:
其中
在所述距离阈值的选定过程中,包括:对计算所得的密度值ρi从大到小进行排序,定义为的降序排列,ρqN满足其中δqi为每一镜头的距离值,计算公式为:
选取大于所述密度阈值和距离阈值镜头的关键帧为聚类中心,并对聚类中心赋予标签。
2.根据权利要求1所述的一种视频聚类切分方法,其特征在于,上述特征向量的计算包括:
对切分后的粗镜头抽取一定数目的关键帧,将抽取的关键帧转化为4维张量,并将转化结构输入所述Resnet18网络中。
3.根据权利要求1所述的一种视频聚类切分方法,其特征在于,建立粗镜头关键帧的时间戳,所述特征向量根据时间戳排列输出。
4.根据权利要求1所述的一种视频聚类切分方法,其特征在于,计算所述密度值和距离值小于所述密度阈值和距离阈值关键帧到任意聚类中心的距离,并将该镜头归类到最接近的聚类中心。
5.根据权利要求4所述的一种视频聚类切分方法,其特征在于,采用FFmpeg程序对相同聚类中相邻时间的片段进行切分。
6.根据权利要求1所述的一种视频聚类切分方法,其特征在于,采用OpenCV识别每一帧图像中的像素信息。
7.一种视频聚类切分系统,所述系统采用上述权利要求1-6中任意一种视频聚类切分方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010165676.1/1.html,转载请声明来源钻瓜专利网。