[发明专利]车载音视频监控系统实现多方通话的一种音频混音方法在审
申请号: | 202110886253.3 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113810650A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 董明洲;冯枫 | 申请(专利权)人: | 武汉长江通信智联技术有限公司;武汉长江通信产业集团股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N7/18;H04L29/06 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 黄小灵 |
地址: | 430074 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车载 视频 监控 系统 实现 多方 通话 一种 音频 方法 | ||
1.车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:包括如下步骤:
S1、监控中心发起云会议调度指令,音视频服务器接收到会议指令后将指令下发到各个车载终端,各车载终端和音视频服务器建立通信连接,创建语音信道;
S2、音视频服务器建立数据缓冲池,音视频服务器接收监控中心及车载终端发送过来的音频数据,进行音频解码,解码后的PCM音频数据按序放入二维矩阵缓冲池;
S3、音频数据混音前初处理,首先进行衰减处理,根据音频样本值的取值范围,即采样上下限值,去除低信号样本,确定各路待混音车载音频数据叠加因子初值fmix,将多路待混音车载音频数据分段叠加;
S4、当多路待混音车载音频数据分段叠加的叠加值超采样上下限值,叠加因子分别递减1,直到其叠加值在上下限值内,分段音频数据内的后续所有样本数据作同样处理,分段音频数据叠加完成后,将这k路音频的叠加因子分别递增1,进行声音增益,提高音强;
S5、将混音音频数据发送到云会议所有参与端。
2.根据权利要求1所述的车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:所述步骤S3中进行衰减处理公式如下:
其中,Si为音频样本值,16bit采样,取值范围[-32768,32767];Dt为低信号样本阈值,据实际效果选定Dt=32。
3.根据权利要求1所述的车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:所述步骤S3中叠加公式如下:
其中,n表示某一路待混音音频分段数,i表示每音频分段数据中音频样本数,k表示用于混音的音频路数,SUMni为第n段第i个音频样本值累加和,Skni表示第k路音频第n段第i个样本值,fk表示第k路混音音频叠加因子,fmix表示各路待混音车载音频叠加因子初值,此值为据应用场景设定的一个固定值。
4.根据权利要求3所述的车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:所述步骤S4中在n=0首段音频数据开始混音叠加时fk=fmix,k路待混音音频叠加值超采样上下限值,则这k路的叠加因子分别递减1,其运算公式为:
fk-=1(fk>1);
直到其叠加值在上下限值内,分段音频数据内的后续样本数据作同样处理。分段音频数据叠加完成后,将这k路音频的叠加因子分别递增1,进行声音增益,提高音强,其运算公式为:
fk+=1(fk<fmix)。
5.根据权利要求1所述的车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:所述步骤S5在数据发送之前,需要将音视频服务器混音时过滤掉自身音频数据,对于同一个云会议间的各终端和控制中心,在向某一端发送混音数据时,其发送的混音数据是排除自身音频数据进行的混音数据。
6.根据权利要求5所述的车载音视频监控系统实现多方通话的一种音频混音方法,其特征在于:所述步骤S5中,将待发送混音数据进行音频编码压缩,压缩格式和各路音频发送过来的音频编码格式一致,然后分别将混音音频数据发送到云会议所有参与端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉长江通信智联技术有限公司;武汉长江通信产业集团股份有限公司,未经武汉长江通信智联技术有限公司;武汉长江通信产业集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110886253.3/1.html,转载请声明来源钻瓜专利网。