[发明专利]音频处理方法、装置、存储介质及电子设备有效
| 申请号: | 201910985330.3 | 申请日: | 2019-10-16 |
| 公开(公告)号: | CN110739006B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 徐东 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/60;G06N3/04;G06N3/08 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 处理 方法 装置 存储 介质 电子设备 | ||
1.一种音频处理方法,其特征在于,包括:
获取训练集和验证集,所述训练集中包含多个训练样本,所述验证集中包含多个验证样本;
根据所述训练集中的多个训练样本对模型M0进行学习训练,得到模型M1,其中,模型M1满足预设第一条件,该预设第一条件为模型的损失函数的值小于预设第一阈值且模型的判断准确率达到预设第二阈值;
将所述验证集中的多个验证样本输入所述模型M1,利用模型Mi对所述验证样本进行判断,并在判断错误时将对应的验证样本确定为复核样本,其中,i为大于或等于1的整数,每经过一轮验证i的数值递增1;
将标签信息有误的复核样本确定为目标样本;
更改所述目标样本的标签信息,并基于更改标签信息后的目标样本对模型M0进行学习训练,得到模型Mj,其中,j为大于或等于2的整数,每经过一轮学习j的数值递增1;
触发执行获取多个验证样本及其后的步骤,直至最近得到的预设数量的模型之间的判断准确率的差距小于预设第三阈值,并将最新得到的模型确定为第一目标模型;
根据所述第一目标模型得到预设模型;
获取伴奏音频;
提取所述伴奏音频的音频特征,所述音频特征包括谐波强度在时间上的连续性特征、突变的静音区域特征、梅尔频谱特征、RASTA-PLP特征、PLP特征以及频谱滚降特征中的至少一种;
将所述音频特征输入至预设模型,并获取所述预设模型的输出结果,所述预设模型为经过机器学习的模型;
根据所述输出结果,确定所述伴奏音频的品质等级。
2.根据权利要求1所述的音频处理方法,其特征在于,所述根据所述训练集中的多个训练样本对模型M0进行学习训练,得到模型M1包括:
获取所述训练集中的多个训练样本,各所述训练样本包括伴奏样本对应的音频特征以及标签信息,所述标签信息用于表示伴奏样本的品质等级;
获取模型M0,并利用所述训练样本对所述模型M0进行学习训练,得到模型M1;
获取由所述模型M0训练得到所述模型M1的过程中学习到的第一训练参数;
所述更改所述目标样本的标签信息,并基于更改标签信息后的目标样本对模型M0进行学习训练,得到模型Mj包括:
更改目标样本的标签信息,并记录所述目标样本;
基于更改标签信息后的目标样本选取新的训练样本;
利用第一训练参数以及新的训练样本,对所述模型M0进行学习训练,得到模型Mj,其中,所述模型Mj满足所述预设第一条件;
所述根据所述第一目标模型得到预设模型包括:
利用所述第一目标模型对记录的目标样本进行再次判断,并将再次判断错误的目标样本删除;
在删除再次判断错误的目标样本后,选取新的目标训练样本,并利用所述第一训练参数以及新的目标训练样本,对所述模型M0进行学习训练,得到第二目标模型;
将所述第二目标模型确定为预设模型。
3.根据权利要求2所述的音频处理方法,其特征在于,所述获取所述训练集中的多个训练样本,包括:
获取多个样本音频,所述样本音频为消音后的歌曲伴奏;
对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确定为伴奏样本;
根据所述伴奏样本获取训练样本,得到所述训练集中的多个训练样本。
4.根据权利要求3所述的音频处理方法,其特征在于,所述对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确定为伴奏样本,包括:
对每一样本音频,截取第一播放时间点至第二播放时间点之间的音频部分,并将其确定为伴奏样本,其中,对于播放时长达不到所述第二播放时间点的样本音频进行数据补零处理,以使伴奏样本的时间长度达到预设时长,所述预设时长为所述第一播放时间点与所述第二播放时间点相差的时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910985330.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向瞬态噪声抑制的实时语音增强方法
- 下一篇:一种计算机硬盘读写装置





