[发明专利]通话音频混音处理方法、装置、存储介质和计算机设备有效
| 申请号: | 202010168875.8 | 申请日: | 2020-03-12 |
| 公开(公告)号: | CN111048119B | 公开(公告)日: | 2020-07-10 |
| 发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/84;G10L21/02;G10L19/008 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;杨欢 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通话 音频 处理 方法 装置 存储 介质 计算机 设备 | ||
1.一种通话音频混音处理方法,包括:
获取参与通话的通话成员终端发送的通话音频;
将各通话音频分别划分成多于一帧的音频帧,并计算各所述音频帧分别对应的单帧信噪比;
对于所述通话音频的各音频帧中当前处理的当前帧,基于所述当前帧对应的单帧信噪比,计算相应的即时语音调节参数;
确定在所述当前帧之前的历史帧所对应的历史语音调节参数;
对所述历史语音调节参数和所述当前帧对应的即时语音调节参数进行加权求和处理,得到与所述当前帧对应的语音调节参数;
继续对所述当前帧之后的在后帧进行处理,直到得到所述通话音频中各音频帧分别对应的语音调节参数;
对于每路通话音频,按照所述通话音频中各音频帧分别对应的语音调节参数,对各音频帧分别进行调节,得到与相应通话成员终端对应的调节音频,并基于各所述调节音频进行混音处理得到混合音频。
2.根据权利要求1所述的方法,其特征在于,所述获取参与通话的通话成员终端发送的通话音频,包括:
接收由参与通话的通话成员终端所发送的音频编码数据;所述音频编码数据通过采用与相应终端的终端性能匹配的编码方式,对采集得到的通话音频进行编码得到;
按照与各编码方式分别匹配的解码方式,对相应各个通话成员终端发送的音频编码数据进行解码,得到相应的通话音频。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
采用与各所述通话成员终端的终端性能匹配的编码方式,分别对所述混合音频进行编码,得到对应不同编码方式的混合编码语音;
按照各所述混合编码语音分别对应的编码方式,将各所述混合编码语音分别发送至与相应编码方式匹配的、且参与所述通话的通话成员终端;发送的所述混合编码语音用于指示所述通话成员终端采用与相应编码方式对应的解码方式,对所述混合编码语音进行解码,得到相应的混合音频。
4.根据权利要求1所述的方法,其特征在于,所述将各通话音频分别划分成多于一帧的音频帧,并计算各所述音频帧分别对应的单帧信噪比,包括:
对于每个通话成员终端各自对应的通话音频,分别将相应的通话音频划分成多于一帧的处于时域空间的音频帧;
将各音频帧从时域空间转换至频域空间得到对应的语音频谱,并确定各所述音频帧分别对应的语音频谱中所包括的多于一个的子带;
对于各音频帧中的各子带,分别计算所述子带对应的子带功率谱和噪声估计值,基于所述子带功率谱和噪声估计值,确定各所述子带对应的子带信噪比;
根据各所述音频帧所包括的子带分别对应的子带信噪比,计算各所述音频帧分别对应的单帧信噪比。
5.根据权利要求4所述的方法,其特征在于,所述对于各音频帧中的各子带,分别计算所述子带对应的子带功率谱和噪声估计值,包括:
对于各音频帧中的每个子带,分别基于所述子带所包括频点的频域复数值,确定与所述子带对应的子带功率谱;
对各所述子带功率谱分别进行平滑处理,得到相应的子带平滑功率谱;
从不同音频帧中对应相同子带序号的子带所对应的子带平滑功率谱中,筛选出最小值作为相应子带序号的各子带所对应的噪声初始值;
对于各音频帧中的每个子带,根据所述子带对应的子带平滑功率谱与噪声初始值,确定与相应子带对应的语音存在概率;
对于各音频帧中的每个子带,根据相应子带所对应的语音存在概率和子带功率谱,确定与相应子带对应的噪声估计值。
6.根据权利要求5所述的方法,其特征在于,所述对各所述子带功率谱分别进行平滑处理,得到相应的子带平滑功率谱,包括:
对于各音频帧中当前处理的当前帧中的当前子带,确定所述当前帧中与当前子带相邻的预设数量的相邻子带;
将所述相邻子带与所述当前子带共同构成子带序列;
按照与所述子带序列对应的权重,对所述子带序列中各子带的子带功率谱进行加权求和处理,得到当前帧中当前子带对应的频域平滑功率谱;
对当前帧的在前帧中对应相同子带序号的历史子带的频域平滑功率谱、以及当前帧中当前子带的频域平滑功率谱进行加权求和处理,得到当前帧中当前子带对应的子带平滑功率谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010168875.8/1.html,转载请声明来源钻瓜专利网。





