[发明专利]一种视频封面选取方法和系统在审
申请号: | 202010354980.0 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111651633A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 何林晋;黄鑫;赵玉良;王连杰 | 申请(专利权)人: | 上海推乐信息技术服务有限公司 |
主分类号: | G06F16/738 | 分类号: | G06F16/738;G06F16/75 |
代理公司: | 北京天驰君泰律师事务所 11592 | 代理人: | 孟锐 |
地址: | 201802 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 封面 选取 方法 系统 | ||
1.一种视频封面选取方法,包括:
从视频中提取画质符合封面要求的多个关键帧;
利用视觉特征分别对所述多个关键帧进行美学预测,获取所述美学预测的结果中排序最高的N个关键帧,其中,N≥2;以及
从所述N个关键帧中选择视频封面。
2.根据权利要求1所述的方法,其中从视频中提取画质符合封面要求的多个关键帧的步骤包括:
对所述视频进行切帧处理以得到多个视频帧;以及
按照预置的图像特征及其阈值逐帧过滤所述多个视频帧以得到多个预关键帧。
3.根据权利要求2所述的方法,其中进一步包括:对所述多个预关键帧按照聚类特征进行聚类,将每一类中聚类特征值最高的M个预视频帧确定为关键帧,其中M≥1。
4.根据权利要求3所述的方法,其中采用k-means聚类算法对所述多个预关键帧进行聚类;其中,聚类中心数量基于视频时长设置,聚类特征为图像特征。
5.根据权利要求3所述的方法,其中采用图像特征作为聚类特征对所述多个预关键帧进行聚类;其中,根据采用的图像特征预置相应的聚类中心及其数量。
6.根据权利要求3所述的方法,其中所述聚类特征为以下图像特征中的一者或多者:亮度、亮度均衡性、清晰度、HSL直方图、垂直方向梯度直方图和水平方向梯度直方图。
7.根据权利要求1所述的方法,其中对所述多个关键帧进行美学预测的步骤包括:
计算所述关键帧的视觉特征值;以及
以所述关键帧的所述视觉特征值作为美学预测模型的输入数据,经所述美学预测模型的计算得到所述关键帧的美学预测分数,其中,所述美学预测模型为利用机器学习算法训练得到的模型。
8.根据权利要求7所述的方法,所述的机器学习算法为随机森林算法、分类树算法、决策树算法、KNN算法LR算法或k-means算法。
9.根据权利要求7所述的方法,其中所述用于预测的所述视觉特征值包括多个一维图像特征的特征值和/或多维图像特征的一个或多个维度的特征值。
10.根据权利要求1所述的方法,其中进一步包括:选择一个或多个一维图像特征和/或一个或多个多维图像特征构造预测所需的视觉特征。
11.根据权利要求1所述的方法,其中进一步包括:分析所述N个关键帧成为视频封面的可能性,将可能性最高的关键帧确定为视频封面。
12.根据权利要求11所述的方法,其中,进一步包括:利用以视频封面图像和非视频封面图像作为训练集得到的深度学习模型计算所述N个关键帧成为视频封面的分类分数;以及将分类分数最高的关键帧确定为视频封面。
13.根据权利要求12所述的方法,其中,所述深度学习模型为采用CNN架构、AlexNet架构、VGG架构、GoogLeNet架构或者ResNet架构的模型。
14.一种视频封面选取系统,包括:
关键帧提取模块,经配置以从视频中提取出多个画质符合封面要求的关键帧;
预测模块,经配置以利用视觉特征分别对所述多个关键帧进行美学预测,获取美学预测结果中排序最高的N个关键帧,其中,N≥2;以及
分析模块,经配置以分析所述N个关键帧,并从中确定出视频封面。
15.根据权利要求14所述的系统,其中所述关键帧提取模块包括:
切帧单元,经配置对所述视频进行切帧处理以得到多个视频帧;以及
过滤单元,经配置以按照预置的图像特征及其阈值逐帧过滤所述多个视频帧以得到多个预关键帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海推乐信息技术服务有限公司,未经上海推乐信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010354980.0/1.html,转载请声明来源钻瓜专利网。