[发明专利]一种背景音乐生成方法、装置及电子设备在审
申请号: | 202111166926.4 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113923517A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 崔国辉 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;G10L15/02;G10L15/06;H04N21/485;H04N21/6587;H04N21/81 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 房德权 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 背景音乐 生成 方法 装置 电子设备 | ||
本发明公开了一种背景音乐生成方法,对获取的目标音视频数据进行语音识别,得到识别文字;利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量;从预先训练的音乐生成器集中,获取所述N个特征向量对应的N个音乐生成器;将所述N个特征向量中每个特征向量输入到对应的音乐生成器中,得到N种风格音乐;将所述N种风格音乐进行合成,得到背景音乐,如此,在将N种风格音乐进行合成得到背景音乐时,由于背景音乐是由N种风格音乐生成的,且N为不小于2的整数,使得背景音乐是由多种风格音乐生成的,不属于现有的音乐和歌曲,如此,使得生成的背景音乐的个性化更强,与用户的需求更匹配。
技术领域
本发明涉及语音处理技术领域,特别涉及一种背景音乐生成方法、装置及电子设备。
背景技术
音乐一直是陪伴人类的一种重要艺术形式,而人类也从未停止对音乐的探索。随着计算机技术的发展,计算机与深度学习技术的结合使得创造音乐得到越来越多的应用。
现有技术中在生成背景音乐时,通常是利用用户预先设定音乐特征参数,输入给神经网络预测未来的音符,或者使用生成对抗神经网络进行音乐生成,能够快速的生成背景音乐,但生成的背景音乐不能很好地满足用户的需求。从而,亟需一种背景音乐生成方法以解决上述问题。
发明内容
本发明实施例提供一种背景音乐生成方法、装置及电子设备,用于生成音视频文件的背景音乐。
本发明实施例第一方面提供一种背景音乐生成方法,所述方法包括:
对获取的目标音视频数据进行语音识别,得到识别文字;
利用自然语言处理技术对所述识别文字进行特征提取,得到N个特征向量,其中,N为不小于2的整数;
从预先训练的音乐生成器集中,获取所述N个特征向量对应的N个音乐生成器;
将所述N个特征向量中每个特征向量输入到对应的音乐生成器中,得到N种风格音乐;
将所述N种风格音乐进行合成,得到背景音乐。
可选的,所述获取所述N个特征向量对应的N个音乐生成器,包括:
获取所述N个特征向量对应的N个情感标签;
根据情感标签与音乐生成器的对应关系,从所述音乐生成器集中获取与所述N个情感标签对应的所述N个音乐生成器。
可选的,所述对获取的目标音视频数据进行语音识别,得到识别文字,包括:
对获取的所述目标音视频数据进行音频提取,得到用户音频数据;
对所述用户音频数据进行语音识别,得到所述识别文字。
可选的,所述音乐生成器集的训练步骤包括,包括:
获取训练样本集,所述训练样本集中每个训练样本包括训练音视频数据;
针对训练样本集中的每个训练样本,对训练样本的训练音视频数据进行语音识别,得到训练识别文字;利用自然语言处理技术对所述训练识别文字进行特征提取,得到M个特征向量,其中,M为不小于N的整数;
采用对抗网络,利用每个训练样本的M个特征向量对M个音乐生成器进行模型训练,得到训练好的所述M个音乐生成器,将训练好的所述M个音乐生成器作为所述音乐生成器集,其中,所述M个音乐生成器与所述M个特征向量对应。
可选的,在得到背景音乐之后,所述方法还包括:
将所述背景音乐添加到所述目标音视频数据中。
本发明实施例第二方面还提供一种背景音乐生成装置,其特征在于,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111166926.4/2.html,转载请声明来源钻瓜专利网。