[发明专利]一种多声道语音信号的时标调制方法和装置有效

申请号：	201210532027.6	申请日：	2012-12-11
公开（公告）号：	CN103871414A	公开（公告）日：	2014-06-18
发明（设计）人：	王凤玲;王田;吴文海;张德军	申请（专利权）人：	华为技术有限公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L21/003
代理公司：	暂无信息	代理人：	暂无信息
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多声道语音信号调制方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信技术领域，特别涉及一种多声道语音信号的时标调制方法和装置。

背景技术

在基于IP的语音通信系统中，会话双方所发出的话音被封装成IP数据包，并通过IP网络进行传输，然后，在接收端对该IP数据包进行解包并还原成语音，从而实现发送端、接收端双方的实时会话。

在基于IP的语音通信系统中，为了保证会话尽量以实时的方式进行，通常使用RTP(实时传输协议)传输协议，而不使用TCP(传送控制协议)协议。在基于IP的语音通信系统中，语音通常按ITU-T(国际电信联盟-电信标准部)建议的G.711、G.723或G.729标准进行编码，然后再进行传输。

目前基于IP的语音通信多是单声道的，自适应抖动缓冲管理(AJBM，adaptiVejitter buffer management)中的时标调制time scaling也是对单个声道进行扩展extend或者压缩compress，但是基于立体声或者多声道的新IP语音通信也在开始研究。

现有技术解决多声道time scaling声场改变的方法，就是通过寻找相同的语音信号扩展或者压缩的长度维持多声道声场的稳定。但是这种方式的主要问题是不能保证每个声道的相似段信号Similar Segment与各自声道的模板段信号Template Segment最相似的。因此，现有技术针对多声道语音信号的时标调制计算时不能保证各声道质量最优，容易产生失真的问题。

发明内容

有鉴与此，本发明的实施例提供了一种多声道语音信号的时标调制time scaling方法和装置，以实现在解决多声道语音信号声场稳定的同时，提供更好的声道质量。

本发明第一方面的实施例公开了一种多声道语音信号的时标调制time scaling方法，其特征在于，包括：获取多声道语音的输入信号以及相关的初始化信息，相关的初始化信息包括帧信号长度、每个声道初始的信号累计长度、时标调制time scaling模式，其中所述每个声道初始的信号累计长度为每个声道的全部帧的帧信号长度的和；

根据所述时标调制模式对所述多声道语音的输入信号做时标调制计算，得到每个声道时标调制后的信号，根据所述每个声道时标调制后的信号更新所述每个声道初始的信号累计长度，得到每个声道时标调制后的信号累计长度；

根据所述每个声道时标调制time scaling后的信号累计长度选择时标调制time scaling后最长的信号累计长度和最短的信号累计长度；

若所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值不大于预设长度阈值，则输出所述每个声道时标调制time scaling后的信号。

根据本发明实施例的多声道语音信号的时标调制time scaling的方法，能够在有效的解决多声道语音信号时标调制time scaling后声场改变问题的同时，保证各个声道时标调制time scaling后的信号质量仍然十分优良，从而使得多声道语音信号在时标调制time scaling后的信号质量在感知听觉上仍能保持较高水准。

在本发明第一方面实施例第一种可能实现的方式中，在所述在根据所述每个声道时标调制后的信号累计长度选择时标调制后最长的信号累计长度和最短的信号累计长度之后还包括：

若所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值大于预设长度阈值，则初始化时标调制time scaling次数值；

对所述时标调制time scaling后信号累计长度最长的或最短的声道做时标调制time scaling，更新所述每个声道时标调制time scaling后的信号，并更新所述每个声道时标调制time scaling后的信号累计长度，根据所述每个声道时标调制timescaling后的信号累计长度更新所述时标调制time scaling后信号累计长度最长的声道索引以及最长的信号累计长度和信号累计长度最短的声道索引以及最短的信号累计长度，所述时标调制time scaling次数值增加1，

重复本步骤直至所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值不大于预设长度阈值。

结合上述任意之一实施例的本发明第一方面实施例第二种可能的实现方式中，在所述时标调制time scaling次数值增加1之后，若所述时标调制time scaling次数值大于预设次数阈值，则输出所述每个声道时标调制time scaling后的信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210532027.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种兼USB与SD卡播放器
下一篇：一种生产5-苯基四氮唑用多滤网离心分离机

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多声道语音信号的时标调制方法和装置有效

专利文献下载