[发明专利]音频处理方法、装置、存储介质及电子设备有效
申请号: | 201910985330.3 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110739006B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 徐东 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/60;G06N3/04;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 存储 介质 电子设备 | ||
本申请公开了一种音频处理方法、装置、存储介质及电子设备。该音频处理方法包括:获取伴奏音频;提取该伴奏音频的音频特征,该音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA‑PLP特征、PLP特征以及频谱滚降特征中的至少一种;将该音频特征输入至预设模型,并获取该预设模型的输出结果,该预设模型为经过机器学习的模型;根据该输出结果,确定该伴奏音频的品质等级。本申请可以有效地确定伴奏的品质。
技术领域
本申请属于音频技术领域,尤其涉及一种音频处理方法、装置、存储介质及电子设备。
背景技术
由于早期音频处理技术的局限性,很多歌曲在录制的过程中,无法对伴奏进行单独的录制,从而使得发行的原版歌曲中混有歌手的声音。为了获取到这些原版歌曲中的伴奏,相关技术中可以利用人声分离等消音处理技术对原版歌曲进行消音处理,从而得到歌曲消音后的伴奏。然而,相关技术中无法对歌曲消音后得到的伴奏的品质进行评价。
发明内容
本申请实施例提供一种音频处理方法、装置、存储介质及电子设备,可以有效地确定伴奏的品质。
本申请实施例提供一种音频处理方法,包括:
获取伴奏音频;
提取所述伴奏音频的音频特征,所述音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;
将所述音频特征输入至预设模型,并获取所述预设模型的输出结果,所述预设模型为经过机器学习的模型;
根据所述输出结果,确定所述伴奏音频的品质等级。
本申请实施例提供一种音频处理装置,包括:
获取单元,用于获取伴奏音频;
提取单元,用于提取所述伴奏音频的音频特征,所述音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;
输入单元,用于将所述音频特征输入至预设模型,并获取所述预设模型的输出结果,所述预设模型为经过机器学习的模型;
确定单元,用于根据所述输出结果,确定所述伴奏音频的品质等级。
本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的音频处理方法。
本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的音频处理方法。
本申请实施例中,电子设备可以从待评价的伴奏音频中提取谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种音频特征,并将提取到的这些音频特征输入至经过学习训练的预设模型中,以得到该预设模型的输出结果,并根据该输出结果确定伴奏音频的品质等级。即,本申请实施例利用音频特征与机器学习可以有效地、客观地确定出伴奏音频的品质等级。
附图说明
下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其有益效果显而易见。
图1是本申请实施例提供的音频处理方法的流程示意图。
图2是本申请实施例提供的音频处理方法的第二种流程示意图。
图3是本申请实施例提供的音频处理方法的第三种流程示意图。
图4A至图4C是本申请实施例提供的音频处理方法的场景示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910985330.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向瞬态噪声抑制的实时语音增强方法
- 下一篇:一种计算机硬盘读写装置