[发明专利]语音混合方法、多点会议服务器和利用该方法的程序无效
申请号: | 200780032555.2 | 申请日: | 2007-08-28 |
公开(公告)号: | CN101513030A | 公开(公告)日: | 2009-08-19 |
发明(设计)人: | 伊藤博纪;小泽一范 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | H04M3/56 | 分类号: | H04M3/56;G10L19/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 宋 鹤;南 霆 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 混合 方法 多点 会议 服务器 利用 程序 | ||
技术领域
本发明涉及语音混合方法、多点会议服务器和利用该方法的程序。更具体而言,本发明涉及对全部参与者的语音进行混合、从混合语音中减去一个参与者的语音、随后将减后的语音发送到同一个参与者的方法,以及多点会议服务器和利用该方法的程序。
背景技术
在多点会议服务中,经语音编码器编码的每个参与者的语音被发送到多点会议服务器。多点会议服务器向每个参与者发送混合了除该参与者之外的其他参与者的语音的语音数据。
在混合语音时,首先,通过将对每个参与者的语音数据进行解码而获得的全部解码语音信号相加来计算出全部参与者的语音信号。接下来,通过从全部参与者的语音信号中减去自己的语音从而获得语音信号,这些语音信号被解码,所生成的语音数据被发送到相应的参与者。
作为多点会议服务中的终端和和服务器之间的通信协议的示例,在电路交换网络中使用了ITU-T H.323和H.324,在移动网络中使用了3G-324M,在基于IP(因特网协议)的分组网络中使用了IETF RFC 3550 RTP(实时传输协议)。
作为语音编码器,可使用作为ITU-T标准的由G.711、G.729和3GPPTS26.090定义的AMR(自适应多速率)方法、由TS26.190定义的AMR-WB(宽带)方法和由3GPP2定义的EVRC(增强可变速率编解码器)方法。
G.711方法通过利用对数变换来将8kHz采样的语音信号中的每个16比特的样本压缩成8个比特,并且在该方法中,计算量较小但是可压缩性比率较低。
另一方面,G.729方法(AMR方法)和EVRC方法是基于根据CELP(码激励线性预测)原理的差分编码(differential coding)方法的,并且它们可以更有效地对语音信号进行编码。
在CELP中,编码器通过利用线性预测分析(LPC:线性预测编码)从每个帧(例如,20ms)的语音信号中提取出示出了该语音信号的频谱特性的频谱参数。
此外,经帧划分的语音信号还被进一步划分成子帧(例如,5ms),基于每个子帧的过去声源信号而提取出自适应码本中的参数(与基音周期相对应的延迟参数和增益参数),并且根据自适应码本预测相应子帧的语音信号的基音。从包括预定类型的噪声信号的声源码本(向量量化码本)中选出最合适的声源码向量,并且针对通过基音预测获得的残留信号计算出最合适的增益,从而对声源信号进行量化。
选择声源码向量以使得上述残留信号和由所选噪声信号合成的信号之间的电功率误差最小化。指示所选码向量的类型的自适应码本中的参数、索引、增益和频谱参数的组合作为语音数据被发送。
解码器根据从语音数据获得的参数来计算声源信号和线性预测分析中的合成滤波器系数,并且通过合成滤波器驱动声源信号,从而获得复语音信号。
专利文献1公开了一种语音混合方法,在该方法中不对每个样本执行比较/选择处理,而是基于对样本大小的比较/选择处理的结果选择跟随所选语音数据的样本后的多个样本。
此外,专利文献2公开了一种语音混合方法,在该方法中,一旦在混合单元中生成了加和信号,其自身的语音信息(由一个用户发送的语音信息)就被从加和信号中减去,并且该用户之外的其他用户的语音信息被返回给自身。
专利文献3公开了一种通信单元,在该通信单元中语音合成单元将由每个异类(heterogeneous)编码/解码单元转换成线性数据的每个语音数据相加,此后,通过从相加得到的语音数据中减去自己的语音数据而生成语音数据,并且其被发送到相应的异类编码/解码单元。
专利文献1:日本专利公布早期公开No.2005-151044(第0014、0016和0045段)
专利文献2:日本专利公布早期公开No.2005-229259(第0003段和图1)
专利文献3:日本专利公布早期公开No.6-350724(第0020段和图2)
在现有技术的多点会议系统中,混合有除自身参与者之外的其他所有参与者的语音的语音被编码并且被发送给每个参与者。此刻,由于语音编码的计算量随参与者数目增加而增大,所以系统使用一种方法,来检测正在发音的每个扬声器并且限制要被混合的语音的数目,从而减少要操作的语音编码器的数目。
在利用执行诸如CELP方法之类的差分编码的语音编码器的情形中,由于根据扬声器的改变而切换编码器时示出该编码器的状况的存储器中存在不一致性,所以存在在经解码语音中出现异常声音的问题。
在上述专利文献1至3中未公开用于解决该问题的手段。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780032555.2/2.html,转载请声明来源钻瓜专利网。