[发明专利]一种音频信号处理的方法及装置有效
申请号: | 202010009960.X | 申请日: | 2020-01-06 |
公开(公告)号: | CN111179947B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 沈俊聪;陈勇华 | 申请(专利权)人: | 广州欢聊网络科技有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L21/02;G10L21/0272 |
代理公司: | 广州佳睿知识产权代理事务所(普通合伙) 44610 | 代理人: | 李健富;朱彩银 |
地址: | 510000 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 处理 方法 装置 | ||
本申请涉及一种音频信号处理的方法及装置,其中所述方法包括:获取背景音乐信号以及用户录入的干音信号,并分别对所述背景音乐信号及所述干音信号进行分帧处理,获得对应的背景音乐帧序列以及干音帧序列;针对所述干音帧序列的各干音帧数据,确定所述干音帧数据的处理状态,所述处理状态包括第一值及第二值;对处理状态为第二值的干音帧数据进行增益保护处理;将进行增益保护处理获得的干音帧数据以及对应时间的背景音乐帧数据进行混音处理,获得用于输出的混音帧信号。本实施例可以提升音量小的干音信号的音量水平,让节目中各种声音的音量波动尽可能的小,提高用户的收听体验,进而提升用户留存。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种音频信号处理的方法及装置。
背景技术
随着信息时代的到来,用户获取信息和发布信息的需求越来越强烈,越来越多用户使用手机等终端录制和发布音视频节目。
通常,在一个包含音频的节目中,可能会包含人声、背景音乐、环境音等不同声音,每种类型的声音的音量也有差别(例如摇滚类型的歌曲通常会比人的声音的音量大)。并且,使用不同厂商的终端录制出来的音量也会不同,导致听众在收听不同节目时,音量会参差不齐,影响用户体验。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种音频信号处理的方法及装置。
第一方面,本申请提供了一种音频信号处理的方法,所述方法包括:
获取背景音乐信号以及用户录入的干音信号,并分别对所述背景音乐信号及所述干音信号进行分帧处理,获得对应的背景音乐帧序列以及干音帧序列;
针对所述干音帧序列的各干音帧数据,确定所述干音帧数据的处理状态,所述处理状态包括第一值及第二值;
对处理状态为第二值的干音帧数据进行增益保护处理;
将进行增益保护处理获得的干音帧数据以及对应时间的背景音乐帧数据进行混音处理,获得用于输出的混音帧信号。
可选地,各干音帧数据中包括多个采样点;
所述针对所述干音帧序列的各干音帧数据,确定所述干音帧数据的处理状态,包括:
将各采样点的能量值转换成指定类型的浮点数,所述浮点数在[-1.0,1.0]区间内;
对各浮点数进行放大处理;
根据所述干音帧数据中包括的采样点的数量以及各采样点对应的放大后的浮点数,确定所述干音帧数据的平均能量;
若所述平均能量大于预设能量值,则将所述干音帧数据的处理状态确定为第一值;
若所述平均能量小于或等于预设能量值,则将所述干音帧数据的处理状态确定为第二值。
可选地,所述方法还包括:
若所述干音帧数据的处理状态为所述第一值,则将所述干音帧数据的各采样点的能量值乘以预设音量调整因子,其中,所述音量调整因子为小于1的正数。
可选地,所述对处理状态为第二值的干音帧数据进行增益保护处理,包括:
确定所述干音帧数据的各采样点的能量值;
分别判断各采样点的能量值是否在预设的能量区间内;
若否,则将该采样点的能量值调整为指定能量值,所述指定能量值为所述能量值距离所述能量区间最接近的端点的值;
基于各采样点的最新能量值,进行帧间平滑处理。
可选地,所述基于各采样点的最新能量值,进行帧间平滑处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢聊网络科技有限公司,未经广州欢聊网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010009960.X/2.html,转载请声明来源钻瓜专利网。