[发明专利]音频转换方法、音频转换装置及设备在审
| 申请号: | 202011589644.0 | 申请日: | 2020-12-29 |
| 公开(公告)号: | CN113539214A | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 田思达 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/30 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 转换 方法 装置 设备 | ||
1.一种音频转换方法,包括:
获取待转换音频以及指定转换类型;
对所述待转换音频进行音源分离处理,以获取所述待转换音频的主旋律音轨;
基于所述主旋律音轨预测所述待转换音频的乐谱,以生成预测乐谱;以及
基于所述预测乐谱生成所述指定转换类型的转换音频。
2.根据权利要求1所述的音频转换方法,其中,获取待转换音频包括:
输入包含音频的多媒体内容或者所述多媒体内容的链接;以及
提取所述多媒体内容中的音频作为所述待转换音频。
3.根据权利要求2所述的音频转换方法,其中,所述多媒体内容是视频文件、音频文件、视频流、音频流中的任一种,所述预测乐谱包括用符号表示的乐曲信息,所述乐曲信息包括具有音高、起始时间和终止时间的不同节拍。
4.根据权利要求1所述的音频转换方法,其中,对所述待转换音频进行音源分离处理以获取所述待转换音频的主旋律音轨包括:
将所述待转换音频划分为至少两个分离音轨,所述至少两个分离音轨包括主旋律音轨和至少一个非主旋律音轨,所述至少一个非主旋律音轨包括:人声音轨、贝斯音轨、鼓点音轨、以及其他音轨中的至少一部分;
从所述至少两个分离音轨中提取所述主旋律音轨。
5.根据权利要求4所述的音频转换方法,还包括:
确定所述至少一个非主旋律音轨中的、要加入到所述转换音频中的目标非主旋律音轨;
将所述目标非主旋律音轨添加到所述转换音频中。
6.根据权利要求1所述的音频转换方法,其中,基于所述主旋律音轨预测所述待转换音频的乐谱以生成预测乐谱包括:
提取所述主旋律音轨的声音特征参数;以及
将所述声音特征参数输入到深度神经网络中进行预测,以生成所述预测乐谱。
7.根据权利要求1所述的音频转换方法,其中,在基于所述预测乐谱生成所述指定转换类型的转换音频之前,所述音频转换方法还包括:
确定所述预测乐谱中的细碎节拍的数量与节拍的总数的比例,所述细碎节拍为持续时间小于预定时间阈值的节拍;以及
在所述比例超过预定比例阈值时,对所述预测乐谱进行优化处理。
8.根据权利要求7所述的音频转换方法,其中,对所述预测乐谱进行优化处理包括:
对于处于同一音高的、同一小节内部的细碎节拍,执行以下处理中的一项或多项:合并临近的细碎节拍;将细碎节拍分配至附近节拍;延长细碎节拍;以及删除细碎节拍,
其中,所述小节为所述预测乐谱中包括预定数量的节拍或者具有预定时间长度的单位。
9.根据权利要求1所述的音频转换方法,其中,基于所述预测乐谱生成所述指定转换类型的转换音频包括:
在所述预测乐谱中的乐曲信息的控制下,利用所述指定转换类型的音色器文件来合成所述指定转换类型的转换音频,其中,所述音色器文件为存储乐器的真实声音样本的文件。
10.根据权利要求1-9中任一项所述的音频转换方法,还包括:输出所述转换音频,其中,输出所述转换音频还包括以下至少一项:
以文件或链接的形式输出所述转换音频;以及
将所述转换音频添加到对应的视频内容中以生成编辑后的视频内容,并输出所述编辑后的视频内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011589644.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件安装装置
- 下一篇:音乐风格转换方法、装置、设备及存储介质





