[发明专利]音乐视频流派分类方法、装置、计算机设备及存储介质在审
申请号: | 202110742887.1 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113434731A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 张旭龙;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06K9/62;G06N3/04 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 视频 流派 分类 方法 装置 计算机 设备 存储 介质 | ||
1.一种音乐视频流派分类方法,其特征在于,包括:
获取音乐视频文件,从所述音乐视频文件中提取音频数据和视频数据;将所述视频数据划分成若干视频片段;每个所述视频片段包括若干帧图像;
计算所述视频片段的若干帧间光流,将所述若干帧间光流输入预设的时域风格卷积网络进行处理,得到与所述视频片段对应的第一音乐流派分类结果;
提取所述视频片段的关键帧图像,从所述音频数据中截取与所述关键帧图像对应的关键音频数据,将所述关键音频数据输入预设的空间风格卷积网络进行处理,得到与所述视频片段对应的第二音乐流派分类结果;
计算所述若干视频片段的第一音乐流派分类结果和第二音乐流派分类结果的加权平均值,根据所述加权平均值确定所述音乐视频文件的音乐流派类别。
2.如权利要求1所述的音乐视频流派分类方法,其特征在于,所述将所述视频数据划分成若干个视频片段,包括:
从所述视频数据中提取若干画面切换图像;
以所述画面切换图像为裁剪边界帧,将所述视频数据划分成若干个视频片段。
3.如权利要求2所述的音乐视频流派分类方法,其特征在于,所述视频数据包括若干帧视频图像;
所述从所述视频数据中提取若干画面切换图像,包括:
从所述若干帧视频图像中抽取出相邻的第一帧视频图像和第二帧视频图像;
计算所述第一帧视频图像和第二帧视频图像之间的像素点差异值,判断所述像素点差异值是否处于预设的阈值范围;
若所述像素点差异值处于预设的阈值范围,则将所述第二帧视频图像确定为画面切换图像。
4.如权利要求2所述的音乐视频流派分类方法,其特征在于,所述视频数据包括若干帧视频图像;
所述从所述视频数据中提取若干画面切换图像,包括:
每次从所述若干帧视频图像中抽取出时间连续的k帧视频图像,将所述k帧视频图像输入预设的长短期记忆网络中进行处理,得到各帧视频图像的标签值;
将标签值为1的视频图像确定为画面切换图像。
5.如权利要求1所述的音乐视频流派分类方法,其特征在于,所述计算所述视频片段的若干帧间光流,包括:
对所述视频片段中的若干帧图像进行图像缩放处理,得到与所述若干帧图像对应的缩放图像;
基于稠密光流算法对所述缩放图像进行计算,获得与所述视频片段对应的帧间光流。
6.如权利要求1所述的音乐视频流派分类方法,其特征在于,所述从所述音频数据中截取与所述关键帧图像对应的关键音频数据,将所述关键音频数据输入预设的空间风格卷积网络进行处理,包括:
根据预设音频截取规则从所述音频数据中截取与所述关键帧图像对应的关键音频数据;
将所述关键音频数据转换成Mel频谱图;
将所述Mel频谱图输入预设的空间风格卷积网络进行处理。
7.如权利要求1所述的音乐视频流派分类方法,其特征在于,所述计算所述若干视频片段的第一音乐流派分类结果和第二音乐流派分类结果的加权平均值,根据所述加权平均值确定所述音乐视频文件的音乐流派类别,包括:
对同一视频片段的第一音乐流派分类结果和第二音乐流派分类结果进行加权平均运算,得到与所述视频片段对应的第一加权平均值;
对所述若干视频片段的第一加权平均值进行加权平均运算,得到第二加权平均值,根据所述第二加权平均值确定所述音乐视频文件的音乐流派类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110742887.1/1.html,转载请声明来源钻瓜专利网。