[发明专利]多路音频处理方法和系统有效
申请号: | 201911355338.8 | 申请日: | 2019-12-25 |
公开(公告)号: | CN113038060B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 施隆海 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 系统 | ||
本公开提出一种多路音频处理方法和系统,涉及多路音频处理。本公开通过由多点会议单元MCU对接收的多路音频进行对齐和降噪处理,并传输给终端,由终端对多路音频进行混音等语音处理,缓解了MCU的工作压力,降低了对MCU运算能力的要求,提高了MCU的承载能力。
技术领域
本公开涉及多路音频处理,特别涉及一种多路音频处理方法和系统。
背景技术
目前视频会议采用的其中一种组网方案为MCU(Multipoint Conferencing Unit,多点会议单元)方案,该方案由一个MCU和多个终端组成一个星形结构。各终端将自己的音频发送给MCU,MCU会将所有终端的音频进行汇集,对齐,降噪,回声消除,后处理,混音等,最终生成一个混合后的音频再发给各个终端,这样各终端就可以听到其他终端的音频。这种方案MCU的工作压力会非常大,需要有非常强的运算能力。
发明内容
为了缓解MCU的工作压力,降低对MCU运算能力的要求,本公开通过由MCU对接收的多路音频进行对齐和降噪处理,并传输给终端,由终端对多路音频进行混音等语音处理,缓解了MCU的工作压力,降低了对MCU运算能力的要求,提高了MCU的承载能力。
本公开的一些实施例提出一种多路音频处理方法,包括:
多点会议单元对接收的多路音频进行对齐和降噪处理,并传输给终端;
终端对多路音频进行混音,并输出。
在一些实施例中,还包括:多点会议单元对处理后的多路音频进行高级音频编码AAC,然后再执行传输的步骤。
在一些实施例中,还包括:终端对多路音频进行混音包括:终端进行本地的语音活动检测,并基于不同的检测结果对多路音频进行相应的混音处理。
在一些实施例中,还包括:终端基于不同的检测结果对多路音频进行相应的混音处理包括:
如果检测到本地的语音活动,终端对接收的多路音频依次进行回声消除处理和混音处理;
或者,如果未检测到本地的语音活动,终端对接收的多路音频依次进行混音处理和增强处理。
在一些实施例中,还包括:所述增强处理为非线性增强处理。
在一些实施例中,还包括:多点会议单元接收的多路音频为视频会议中的多路音频。
本公开的一些实施例提出一种一种多路音频处理系统,包括:
多点会议单元,被配置为对接收的多路音频进行对齐和降噪处理,并传输给多个终端;
每个终端,被配置为对多路音频进行混音,并输出。
在一些实施例中,还包括:所述多点会议单元,还被配置为对处理后的多路音频进行高级音频编码AAC,然后再执行传输的步骤。
在一些实施例中,还包括:所述终端在对多路音频进行混音时,被配置为:
进行本地的语音活动检测;
如果检测到本地的语音活动,对接收的多路音频依次进行回声消除处理和混音处理;
或者,如果未检测到本地的语音活动,对接收的多路音频依次进行混音处理和增强处理。
在一些实施例中,多点会议单元接收的多路音频为视频会议中的多路音频。
本公开的一些实施例提出一种一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例所述的多路音频处理方法的步骤。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911355338.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种固体制剂及其制备方法和用途
- 下一篇:芯片的制作方法