[发明专利]模型生成、视频处理方法、装置、电子设备及存储介质有效
| 申请号: | 201910458806.8 | 申请日: | 2019-05-29 |
| 公开(公告)号: | CN110324726B | 公开(公告)日: | 2022-02-18 |
| 发明(设计)人: | 贾少勇 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | H04N21/845 | 分类号: | H04N21/845;H04N21/439;H04N21/44;H04N21/233;H04N21/234;G10L25/30;G10L25/51;G10L25/57;G06K9/62;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 生成 视频 处理 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种模型生成、视频处理方法、装置、电子设备及存储介质。模型生成方法包括:获取训练样本;所述训练样本包括样本视频和所述样本视频的标注信息;所述标注信息用于指示所述样本视频是否属于音乐类别;将所述样本视频划分为多个单位样本视频;针对每个单位样本视频,获取所述单位样本视频对应的音频特征向量;将连续至少两个单位样本视频对应的音频特征向量作为输入,将所述样本视频的标注信息作为输出的目标,对预设的初始模型进行训练,将训练完成的模型确定为视频处理模型。本发明避免了仅依据场景图像信息是否发生较大变化进行拆条时导致的拆条不准确的问题,因此拆条得到的音乐片段更加准确。
技术领域
本发明涉及互联网技术领域,特别是涉及一种模型生成、视频处理方法、装置、电子设备及存储介质。
背景技术
随着互联网的飞速发展,各种音乐节目类视频层出不穷,牢牢抓住了观众的注意力,带来视听盛宴。比如综艺频道的音乐选秀视频,如中国好声音、中国新说唱等,以及音乐频道的演唱会视频等。为了满足用户的需求,比如用户可能更加关注音乐节目类视频中的某一个音乐片段,因此可以将音乐节目类视频进行拆条,拆分成多个音乐片段。
现有技术中通常采用基于场景变换的拆条方法对音乐节目类视频进行拆条,根据视频中的场景图像信息是否发生较大变化进行拆条,将场景图像信息发生较大变化的时间点作为拆条分割点。
但是,对于音乐节目类视频来说,存在场景切换而音频并未切换的情况,该种情况下在场景切换的时间点进行拆条是不准确的,因此采用上述方法拆条的准确性较低。
发明内容
本发明实施例提供一种模型生成、视频处理方法、装置、电子设备及存储介质,以解决现有的音乐节目类视频拆条方法准确性较低的问题。
第一方面,本发明实施例提供了一种模型生成方法,所述方法包括:
获取训练样本;所述训练样本包括样本视频和所述样本视频的标注信息;所述标注信息用于指示所述样本视频是否属于音乐类别;
将所述样本视频划分为多个单位样本视频;
针对每个单位样本视频,获取所述单位样本视频对应的音频特征向量;
将连续至少两个单位样本视频对应的音频特征向量作为输入,将所述样本视频的标注信息作为输出的目标,对预设的初始模型进行训练,将训练完成的模型确定为视频处理模型。
可选地,所述获取所述单位样本视频对应的音频特征向量,包括:生成所述单位样本视频中的音频信号对应的频谱图;将所述单位样本视频中的音频信号对应的频谱图输入预设的神经网络模型,将所述神经网络模型输出的音频特征向量确定为所述单位样本视频对应的音频特征向量。
可选地,所述生成所述单位样本视频中的音频信号对应的频谱图,包括:对所述单位样本视频中的音频信号进行分帧处理,得到多个音频信号帧;对每个音频信号帧进行加窗处理及傅里叶变换处理,得到所述单位样本视频中的音频信号对应的初始频谱图;对所述初始频谱图进行梅尔变换处理得到梅尔频谱图,将所述梅尔频谱图作为所述单位样本视频中的音频信号对应的频谱图。
可选地,所述将连续至少两个单位样本视频对应的音频特征向量作为输入,将所述样本视频的标注信息作为输出的目标,对预设的初始模型进行训练,包括:随机抽取连续至少两个单位样本视频,将抽取的单位样本视频对应的音频特征向量拼接后输入所述初始模型,得到所述样本视频属于音乐类别的预测概率;根据所述样本视频属于音乐类别的预测概率以及所述样本视频的标注信息,计算所述样本视频对应的损失值;在所述损失值小于设定损失阈值时,确定训练完成。
第二方面,本发明实施例提供了一种视频处理方法,所述方法包括:
获取待处理视频;
将所述待处理视频划分为多个单位待处理视频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910458806.8/2.html,转载请声明来源钻瓜专利网。





