[发明专利]一种轻量级的多方会议混音方法和装置在审
申请号: | 201410414450.5 | 申请日: | 2014-08-21 |
公开(公告)号: | CN104167210A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 王田;蔡奕侨;钟必能;陈永红;田晖;张国亮 | 申请(专利权)人: | 华侨大学 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;H04N7/15;H04L29/06 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;林燕玲 |
地址: | 362000*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 轻量级 多方 会议 方法 装置 | ||
1.一种轻量级的多方会议混音方法,其特征在于:1)客户端采用AMR编码器对语音进行编码后得到语音PCM数据及数据长度,对编码后的语音PCM数据采用分帧处理,计算每帧语音能量值,并结合该帧语音能量值及其数据长度来确定该帧为语音帧或非语音帧,从而统计出语音PCM数据中语音帧的概率值;2)服务器端通过接收到的语音概率值选出当前的语音概率值最高的两个发言者的语音流,并根据这两个语音概率值大小决定是否使用叠加原理将选出的最多两路语音流进行混音,最后转发混音后的语音包。
2.如权利要求1所述的一种轻量级的多方会议混音方法,其特征在于:预先设定:客户端每隔一段时间抓取到一帧语音信号,每帧语音信号包括m个采样值,每个采样值的能量为ri;设定统计窗口包括连续的n帧语音信号,当前帧的能量相对参考值为Erefer;步骤1)具体包括如下:
1.1)客户端输入语音PCM数据及AMR编码后的输出长度,计算当前帧语音PCM数据的能量值
1.2)判断AMR编码后的当前帧输出长度是否等于31,若是,则记录该帧的能量值,作为语音能量参考值,判定该帧为语音帧并加入统计窗口内,进入步骤1.4);若否,则记录该帧的能量值,作为非语音能量参考值,进入步骤1.3);
1.3)判断当前帧能量值是否大于其能量相对参考值Erefer,若是,则判定该帧为语音帧,若否,则判定该帧为非语音帧;加入新的统计窗口内,进入步骤1.4)
1.4)判断统计窗口是否已满,若是,则计算统计窗口内语音帧的占比,表示成0到100的语音概率值;若否,则进入下一帧,跳至步骤1.1)。
3.如权利要求2所述的一种轻量级的多方会议混音方法,其特征在于:设定当前帧的前n个连续帧的非语音能量参考值的最大值为Enoise,而语音能量参考值的最大值表示为Evoise,则当前帧的能量相对参考值Erefer用如下公式计算:
Erefer=Enoise+(Evoice-Enoise)/10。
4.如权利要求1所述的一种轻量级的多方会议混音方法,其特征在于:步骤2)具体如下:
2.1)服务器接收客户端发送过来的语音概率值,选出语音概率值最高的两条语音流F1、F2,其语音概率值分别为P1、P2,P1>P2;
2.2)判断P1>2P2是否成立,若是,则只将P1对应的语音流输出;若否,则将这两条语音流进行混音后输出。
5.一种轻量级的多方会议混音装置,包括客户端和服务器,其特征在于:
客户端包括:用于对语音进行编码得到语音PCM数据及数据长度的AMR编码器、用于计算编码后的语音PCM数据的每帧语音能量值的语音能量计算装置、结合语音能量值及其数据长度来确定该帧为语音帧或非语音帧的判定装置,及统计出语音PCM数据的统计窗口中语音帧的概率值的统计装置;
服务器包括:用于接收语音概率值并选出当前的语音概率值最高的两个发言者的语音流的接收选择装置,根据这两个语音概率值大小决定是否使用叠加原理将选出的最多两路语音流进行混音的混音装置,及转发语音包的发送装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410414450.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种燃气计量方法、系统和智能燃气表
- 下一篇:纸张类处理装置及纸张类处理机构