[发明专利]一种多路音频混音方法及装置在审

申请号：	201911363456.3	申请日：	2019-12-26
公开（公告）号：	CN113053399A	公开（公告）日：	2021-06-29
发明（设计）人：	李雄峰	申请（专利权）人：	浙江大搜车软件技术有限公司
主分类号：	G10L21/007	分类号：	G10L21/007
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	李威
地址：	310000 浙江省杭州市余***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种多路音频混音方法和装置，所述方法包括：接收由多个音频源发送的原始音频数据；根据各个原始音频数据的短时能量值的高低，顺次选取排列在先的预设数量的原始音频数据；对选取的原始音频数据进行混音处理，以将混音后的音频数据传输至音频接收方。通过本申请的技术方案，能够优化混音后的声音不清晰、啸叫声音明显等问题，提高了混音后的音频音质。

技术领域

本申请涉及网络技术领域，具体涉及一种多路音频混音方法及装置。

背景技术

随着现代技术的快速发展，音频交互存在越来越广泛的应用场景，诸如电话会议场景、多人参与交互的直播场景以及游戏过程中的多人实时语音聊天场景等，因而在群体社交的需求愈来愈强烈的现代社会中，基于音频交互的群体社交过程中混音后的音频体验极为重要。

相关技术中对各路音频数据全部进行混音的混音方式不仅造成音质差、噪声明显，而且极易产生啸叫，尤其在多人进行音频交互的场景中混音效果的缺点更为明显。

发明内容

有鉴于此，本申请提供一种多路音频混音方法及装置，以解决相关技术中存在的技术问题。

为实现上述目的，本申请提供技术方案如下：

根据本申请的第一方面，提出了一种多路音频混音方法，包括：

接收由多个音频源发送的原始音频数据；

根据各个原始音频数据的短时能量值的高低，顺次选取排列在先的预设数量的原始音频数据，其中，所述短时能量值由原始音频数据在预设时长内的各帧音频数据的短时能量而得到；

对选取的原始音频数据进行混音处理，以将混音后的音频数据传输至音频接收方。