[发明专利]一种基于声音评价的会议舒适噪音混音系统及其方法有效
| 申请号: | 201811086506.3 | 申请日: | 2018-09-18 |
| 公开(公告)号: | CN109819129B | 公开(公告)日: | 2020-05-29 |
| 发明(设计)人: | 李华松;陈尚武;卢锡芹 | 申请(专利权)人: | 杭州叙简科技股份有限公司 |
| 主分类号: | G10L19/012 | 分类号: | G10L19/012 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
| 地址: | 310012 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 声音 评价 会议 舒适 噪音 音系 及其 方法 | ||
1.一种基于声音评价的会议舒适噪音混音系统,其特征在于,包括音频输入模块(1),音频输出模块(2),噪音分类模块(3),声音衰减模块(4),噪音截断模块(5),噪音控制模块(6),混音模块(7),白噪声产生模块(8),声音检测模块(9),音频终端;
所述音频终端:是能够进行双向语音采集、播放、传输的设备;音频终端的语音发送到音频输入模块(1),音频终端的语音从音频输出模块(2)接收;
所述音频输入模块(1)是用于接收来自网络、音频线的语音模块;音频输入模块(1)接收来自音频终端的语音,并把语音的音频数据同时复制转发给噪音分类模块(3)与声音检测模块(9);
所述音频输出模块(2)是用于把语音输出到网络、音频线的模块;音频输出模块(2)接收来自混音模块(7)的语音的音频数据;音频输出模块(2)把语音输出到音频终端;
所述噪音分类模块(3)是用于检测输入音频流的噪音进行分类的模块;噪音分类模块(3)接收音频输入模块(1)发来输入音频流;噪音分类模块(3)接收声音检测模块(9)的是否有语音的检测结果、以及音频流无语音的声音能量值与有语音的声音能量值、以及语音能量值与噪音能量值的除数;
所述声音衰减模块(4)用于对语音的音频数据进行衰减处理,以达到减低噪音效果;声音衰减模块(4)接收噪音分类模块(3)的音频流,衰减后把音频流重新发给噪音分类模块(3);
所述噪音截断模块(5)用于处理信噪比差的音频流,避免这些音频流影响会议质量;噪音截断模块(5)接收噪音分类模块(3)的音频流,噪音截断模块(5)接收声音检测模块(9)的是否有语音的检测结果,没有语音的音频流将被截断,不输出到噪音控制模块(6);噪音截断模块(5)把有语音的音频流输出给噪音控制模块(6);
所述噪音控制模块(6)用于接收来自噪音分类模块(3)与噪音截断模块(5)的音频流;噪音控制模块(6)接收声音检测模块(9)的是否有语音的检测结果,没有语音的根据噪音能量值确定是否参与混音;噪音控制模块(6)把需要混音的音频流输出到混音模块(7);
所述混音模块(7)是分别为所有与会音频终端混合的听到声音的模块;混音模块(7)接收噪音控制模块(6)与白噪声产生模块(8)的音频流进行混音;混音模块(7)把混音后的音频流发送给音频输出模块(2);
所述白噪声产生模块(8)是用于产生整个频域内均匀分布的噪声音频流的模块;白噪声产生模块(8)接收噪音控制模块(6)的控制消息,产生符合噪音能量值的音频流;白噪声产生模块(8)把白噪音的音频流输出到混音模块(7);
所述声音检测模块(9)是使用声音跳变限位自适应检测方法来检测音频流是噪音还是语音的模块;声音检测模块(9)接收来自音频输入模块(1)的音频流;声音检测模块(9)把语音的检测结果分别输出到噪音分类模块(3)、噪音截断模块(5)和噪音控制模块(6)。
2.一种基于声音评价的会议舒适噪音混音方法,其特征在于,包括如下步骤:
步骤(1)、音频输入模块(1)接收来自音频终端的语音,并把语音的音频数据同时复制转发给噪音分类模块(3)和声音检测模块(9);
步骤(2)、声音检测模块(9)使用声音跳变限位自适应检测方法来确定音频流是噪音还是语音;
采用声音跳变限位自适应检测方法,设置一个能量值检测值区间(t1~t2),初始能量值检测阀值为t,t在t1~t2区间内;能量值检测值调整策略,使用初始能量值检测阀值t检测到无语音,当按照t(n)=(t(n-1)+噪音能量值×2)÷2公式计算新能量检测阀值,使用公式较快获取噪音下限,如果t(n)小于能量值检测值区间下限t1,则t(n)取值t1,如t(n)大于能量值检测值区间上限t2,则t(n)取值t2;使用初始能量值检测阀值t检测到有语音,语音持续时间超过预设时间,以避免把噪音误识别为语音,需要增大阀值,按照t(n)=(t(n-1)+语音能量值)÷2公式计算增大能量检测阀值;
步骤3、噪音分类模块(3)把音频流的噪音进行评价分类
(3.1)、噪音分类模块(3)接收音频输入模块(1)发来输入音频流;
(3.2)、噪音分类模块(3)接收声音检测模块(9)的是否有语音的检测结果,输入音频流无语音的声音能量值与有语音的声音能量值,以及语音能量值与噪音能量值的除数;
(3.3)、噪音分类模块(3)判断噪音能量值大于噪音阈值tz,判断语音能量值是否大于语音阈值tv,语音能量值小于则判断此音频为噪音过大类型,如果语音能量值大则认为可衰减降噪类型;
(3.3)、噪音分类模块(3)判断噪音能量值大于噪音阈值tz,判断语音能量值是否大于语音阈值tv,语音能量值小于则判断此音频为噪音过大类型,如果语音能量值大则认为可衰减降噪类型;
(3.5)、噪音分类模块(3)把可衰减降噪的音频输出到声音衰减模块(4)进行衰减降噪,声音衰减模块(4)把声音按照语音阈值tv除以语音能量值的比例进行衰减,声音衰减模块(4)音频衰减音频流返回给噪音分类模块(3);
(3.6)、噪音分类模块(3)把噪音过大的音频流输出给噪音截断模块(5);
(3.7)、噪音分类模块(3)判断噪音能量值小于噪音阈值tz时,再与静音闸值tj判断,噪音能量值大于静音闸值tj,则认为噪音正常类型,噪音能量值小于静音闸值tj则认为噪音偏小类型;
(3.8)、噪音分类模块(3)把正常噪音与无噪音的音频流输出给噪音控制模块(6);
步骤(4)、噪音截断模块(5)处理信噪比差的音频流,避免这些音频流影响会议质量;噪音截断模块(5)接收噪音分类模块(3)的音频流,噪音截断模块(5)接收声音检测模块(9)的是否有语音的检测结果,没有语音的音频流将被截断,不输出到噪音控制模块(6);噪音截断模块(5)把有语音的音频流输出给噪音控制模块(6);
步骤(5)、噪音控制模块(6)通过计算噪音能量控制参与混音,让所有与会的音频终端听到噪音舒适的方法;
(5.1)、噪音控制模块(6)接收来自噪音分类模块(3)与噪音截断模块(5)的音频流;
(5.2)、噪音控制模块(6)接收声音检测模块(9)的是否有语音的检测结果;并累加各个音频流的有语音的时长;
(5.3)、噪音控制模块(6)在会议中所有的音频流都没有语音,则开始计算会议噪音值,会议无语音时噪音控制噪音下限n1以上,选择正常噪音的音频流噪音能量值进行累加,累加值超过噪音区间下限n1停止累加,参与累加的音频流进行下一步混音,优先选择有语音的时间长的音频流进行累加,会议有语音时背景噪音与无语音的噪音的一致性更强;当噪音累加值达不到下限n1时,控制白噪声产生模块(8)产生白噪音进行补偿,白噪音的噪音能量值为n1-累加值;
(5.4)、白噪声产生模块(8)产生整个频域内均匀分布的噪声音频流;白噪声产生模块(8)接收噪音控制模块(6)的控制消息,产生符合n1-累加值噪音能量值的音频流;白噪声产生模块(8)把白噪音的音频流输出到混音模块(7);
(5.5)、噪音控制模块(6)在会议中所有的音频流有语音时,则所有有语音的音频流参与下一步混音;
(5.6)、噪音控制模块(6)把需要混音的音频流输出到混音模块(7);
步骤(6)、混音模块(7)分别为所有与会音频终端混合的听到声音;混音模块(7)接收噪音控制模块(6)与白噪声产生模块(8)的音频流进行混音;混音模块(7)对参与音频流的音频流的每采样PCM数据进行累加,计算混音后的声音能力值,如大于声音闸值t h,则混音后进行按每采样PCM数据衰减幅度为声音闸值th除以声音能力值的比值;混音模块(7)把混音后的音频流发送给音频输出模块(2);
步骤(7)、音频输出模块(2)把混音的音频流复制分发给各个音频终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州叙简科技股份有限公司,未经杭州叙简科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811086506.3/1.html,转载请声明来源钻瓜专利网。





