[发明专利]混音方法及装置、终端及可读存储介质有效
| 申请号: | 201810052740.8 | 申请日: | 2018-01-19 |
| 公开(公告)号: | CN110060696B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/20;G10L25/84 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;贾允 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 方法 装置 终端 可读 存储 介质 | ||
本发明公开了一种混音方法及装置、终端及可读存储介质,方法包括:获取待混音的各方语音信号,基于混音信号的信噪比最优原则,计算各方语音信号的第一混音权重,利用该各方语音信号及各方语音信号的第一混音权重进行混音处理,得到混音信号。相对于现有技术,通过基于混音得到的混音信号的信噪比最优原则,确定混音时各方语音信号的第一混音权重,使得混音之后的混音信号的信噪比最优,即最大化,其中,混音信号的信噪比最优原则使得信噪比小的一方语音信号的混音权重相应的较小,信噪比大的一方语音信号的混音权重相应的较大,降低混音使用到的语音信号的噪声对混音后的混音信号的影响,提高多方通话的通话质量。
技术领域
本发明涉及音频技术领域,尤其涉及一种混音方法及装置、终端及可读存储介质。
背景技术
混音是指多方通话场景下,将多人的音频混合成一个混音信号的过程,混音主要应用在语音会议,在线多人聊天等多方通话场景中。
多方通话无论是在传统的电信网络通讯还是互联网协议语音技术(Voice OverInternet Protocol,VOIP)通信应用中都是重要的沟通需求。多方通话过程中各通话方利用终端设备进行语音接入,将语音信号发送给混音模块,混音模块的作用就是将除待发送的目标方以外的其他各方的有效语音进行混音处理,并将混音信号发送给目标方,进而目标方的用户可以听到其他各方的声音,其他方亦然。
然而,目前在多方通话中,存在多方通话的通话质量差的问题。
发明内容
本发明的主要目的在于提供一种混音方法及装置、终端及可读存储介质,旨在解决现有技术中多方通话存在通话质量差的技术问题。
为实现上述目的,本发明第一方面提供混音方法,包括:
获取待混音的各方语音信号;
计算所述各方语音信号的语音能量,并对所述各方语音信号包含的噪声进行能量跟踪,得到所述各方语音信号的噪声能量;
基于混音信号的信噪比最优原则,利用所述各方语音信号的语音能量和噪声能量,计算所述各方语音信号的第一混音权重;
利用所述各方语音信号及所述各方语音信号的第一混音权重进行混音处理,得到混音信号。
为实现上述目的,本发明第二方面提供混音装置,包括:
第一获取模块,用于获取待混音的各方语音信号;
第一计算模块,用于计算所述各方语音信号的语音能量,并对所述各方语音信号包含的噪声进行能量跟踪,得到所述各方语音信号的噪声能量;
第二计算模块,用于基于混音信号的信噪比最优原则,利用所述各方语音信号的语音能量和噪声能量,计算所述各方语音信号的第一混音权重;
第一混音模块,用于利用所述各方语音信号及所述各方语音信号的第一混音权重进行混音处理,得到混音信号。
为实现上述目的,本发明第三方面提供一种终端,包括:存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如本发明实施例第一方面提供的混音方法中的各个步骤。
为实现上述目的,本发明第四方面提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如本发明第一方面提供的混音方法中的各个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810052740.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于说话者验证的动态阈值
- 下一篇:一种情感特征提取方法





