[发明专利]一种轻量级的多方会议混音方法和装置在审

申请号：	201410414450.5	申请日：	2014-08-21
公开（公告）号：	CN104167210A	公开（公告）日：	2014-11-26
发明（设计）人：	王田;蔡奕侨;钟必能;陈永红;田晖;张国亮	申请（专利权）人：	华侨大学
主分类号：	G10L19/008	分类号：	G10L19/008;H04N7/15;H04L29/06
代理公司：	厦门市首创君合专利事务所有限公司 35204	代理人：	张松亭;林燕玲
地址：	362000***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种轻量级多方会议方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种轻量级的多方会议混音方法，其特征在于：1)客户端采用AMR编码器对语音进行编码后得到语音PCM数据及数据长度，对编码后的语音PCM数据采用分帧处理，计算每帧语音能量值，并结合该帧语音能量值及其数据长度来确定该帧为语音帧或非语音帧，从而统计出语音PCM数据中语音帧的概率值；2)服务器端通过接收到的语音概率值选出当前的语音概率值最高的两个发言者的语音流，并根据这两个语音概率值大小决定是否使用叠加原理将选出的最多两路语音流进行混音，最后转发混音后的语音包。

2.如权利要求1所述的一种轻量级的多方会议混音方法，其特征在于：预先设定：客户端每隔一段时间抓取到一帧语音信号，每帧语音信号包括m个采样值，每个采样值的能量为r_i；设定统计窗口包括连续的n帧语音信号，当前帧的能量相对参考值为E_refer；步骤1)具体包括如下：

1.1)客户端输入语音PCM数据及AMR编码后的输出长度，计算当前帧语音PCM数据的能量值

1.2)判断AMR编码后的当前帧输出长度是否等于31，若是，则记录该帧的能量值，作为语音能量参考值，判定该帧为语音帧并加入统计窗口内，进入步骤1.4)；若否，则记录该帧的能量值，作为非语音能量参考值，进入步骤1.3)；

1.3)判断当前帧能量值是否大于其能量相对参考值E_refer，若是，则判定该帧为语音帧，若否，则判定该帧为非语音帧；加入新的统计窗口内，进入步骤1.4)

1.4)判断统计窗口是否已满，若是，则计算统计窗口内语音帧的占比，表示成0到100的语音概率值；若否，则进入下一帧，跳至步骤1.1)。

3.如权利要求2所述的一种轻量级的多方会议混音方法，其特征在于：设定当前帧的前n个连续帧的非语音能量参考值的最大值为E_noise，而语音能量参考值的最大值表示为E_voise，则当前帧的能量相对参考值E_refer用如下公式计算：

E_refer＝E_noise+(E_voice-E_noise)/10。

4.如权利要求1所述的一种轻量级的多方会议混音方法，其特征在于：步骤2)具体如下：

2.1)服务器接收客户端发送过来的语音概率值，选出语音概率值最高的两条语音流F1、F2，其语音概率值分别为P1、P2，P1>P2；

2.2)判断P1>2P2是否成立，若是，则只将P₁对应的语音流输出；若否，则将这两条语音流进行混音后输出。

5.一种轻量级的多方会议混音装置，包括客户端和服务器，其特征在于：

客户端包括：用于对语音进行编码得到语音PCM数据及数据长度的AMR编码器、用于计算编码后的语音PCM数据的每帧语音能量值的语音能量计算装置、结合语音能量值及其数据长度来确定该帧为语音帧或非语音帧的判定装置，及统计出语音PCM数据的统计窗口中语音帧的概率值的统计装置；

服务器包括：用于接收语音概率值并选出当前的语音概率值最高的两个发言者的语音流的接收选择装置，根据这两个语音概率值大小决定是否使用叠加原理将选出的最多两路语音流进行混音的混音装置，及转发语音包的发送装置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华侨大学，未经华侨大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410414450.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种燃气计量方法、系统和智能燃气表
下一篇：纸张类处理装置及纸张类处理机构

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种轻量级的多方会议混音方法和装置在审

专利文献下载