[发明专利]一种PSTN电话会议混音方法有效
申请号: | 201210039624.5 | 申请日: | 2012-02-21 |
公开(公告)号: | CN103259943A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 刘义鹏;廖永坤 | 申请(专利权)人: | 深圳市东进软件开发有限公司 |
主分类号: | H04M3/56 | 分类号: | H04M3/56;G10L19/008;G10L21/02 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 郭伟刚 |
地址: | 518040 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pstn 电话会议 方法 | ||
技术领域
本发明涉及通信领域,尤其涉及一种PSTN电话会议混音方法。
背景技术
在现代社会中,电话会议已经在越来越多的场合得到应用,在电话会议中,为了保证语音通话质量,一般使用电话线路(PSTN)传输声音,在电话会议系统需要将来自与会各方的声音进行混音,再分别输出至与会各方。如常见的三方会议,比如A、B、C。理论上的混音方法是将A、B的声音混音送给C,将B、C的声音混音送给A,将A、C的声音混音送给B。上述混音方法,当会议方数量增加时,不但混音操作多,也极易溢出。一种简单的混音方法是找出输入能量最大的两方,将最大方的声音播放给次大方,将次大方的声音播放给最大,将最大方和次大方的声音混音除以二,播放给其它与会方。该方法同时只允许最多两方,现场感欠佳,同时也会造成切换频繁,影响会议效果。为了增加效果,需要允许更多的方数参与混音。当混音方数增加时,为了避免溢出,通常的混音方法将混音方声音简单除以混音方数后再进行混音。该方法虽然避免了溢出,却造成混音输出声音时大时小,影响了会议效果。同时,在PSTN电话系统中,回声往往很大,同时噪声情况复杂多变,在较多方参与混音时,由于各方回声和背景噪声参与叠加的影响,如果不加区别的进行混音,会导致输出声音质量严重下降。为此,有些混音方法设置一个噪音门限,来判断与会方是否处于语音活动状态。但基于简单门限判断的方法,面对复杂的通信环境,往往效果欠佳。
发明内容
本发明要解决的技术问题在于提高PSTN电话会议的通话质量,针对现有技术的上述缺陷,提供一种PSTN电话会议混音方法。
本发明解决其技术问题所采用的技术方案是:
构造一种PSTN电话会议混音方法,用于对参与电话会议的与会各方的音频信号进行混音和输出,包括如下步骤:
S1、分别检测与会各方音频的语音活动状态:计算各方音频在固定时间段Tr内的输入时域能量EXi(t)、输出时域能量EYi(t),并计算输入能量短时平均值ASi(t)和输入能量长时平均值ALi(t);对于每一方音频,仅当其输入能量短时平均值ASi(t)除以输入能量长时平均值ALi(t)大于平均能量比值阈值Ta时,并且当其输入时域能量EXi(t)除以根据回声延迟Δt计算对应的输出时域能量EYi(t-Δt)大于回声能量阈值Te时,才被判断为该方音频处于语音活动状态,否则被判断为非语音活动状态;固定时间段Tr、回声延迟Δt、平均能量比值阈值Ta和回声能量阈值Te均预先设置;
将处于语音活动状态的与会各方音频加入会议混音列表或后备列表;将处于混音列表中但不处于语音活动状态的与会方从混音列表中移除;
S2、每隔固定周期对混音列表和后备列表进行替换更新,将后备列表中输入能量较大方替换混音列表中输入能量较小方;
S3、统计混音列表中与会各方输入能量之和,调节增益系数使增益调节后与会各方输入能量之和处于混音能量最大阈值Emax和最小阈值Emin之间,根据调节之后的增益系数将会议混音列表中的与会各路音频输入进行增益调节;混音能量最大阈值Emax和最小阈值Emin均预先设置;
S4、将增益调节后的各方音频输入进行混音,对于不在混音列表中的与会方将混音结果分别对其进行输出,对于在混音列表中的与会方将混音结果减去本方增益调节后的输入进行输出。
进一步地,在所述步骤S1之前还包括:
S0、设置各项参数,包括设置最大混音方数MaxN、固定时间段Tr、回声延迟Δt、平均能量比值阈值Ta、回声能量阈值Te、混音列表替换周期Td、混音能量最大阈值Emax和最小阈值Emin。
具体地,所述步骤S1包括:
S11、令i=1;
S12、判断i是否小于或等于n,如果否,则进入步骤S2,如果是,则进入步骤S13;
S13、计算第i方当前的固定时间段Tr内输入时域能量EXi(t)、输出时域能量EYi(t);计算输入能量短时平均值ASi(t)、长时平均值ALi(t);
S14、判断短时平均值ASi(t)除以长时平均值ALi(t)得到的结果是否大于平均能量比值阈值Ta,如果是,则进入步骤S15,否则进入步骤S18;
S15、判断输入时域能量EXi(t)除以根据回声延迟计算对应的输出时域能量EYi(t-Δt)是否大于回声能量阈值Te,如果是则进入步骤S16,否则进入步骤S18;
S16、判断第i方是否处于混音列表中,如果是,进入步骤是S110,否则进入步骤S17;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市东进软件开发有限公司,未经深圳市东进软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210039624.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:D-丝氨酸的制备方法
- 下一篇:仿水母机器人及其控制方法