[发明专利]一种多声道语音信号的时标调制方法和装置有效
申请号: | 201210532027.6 | 申请日: | 2012-12-11 |
公开(公告)号: | CN103871414A | 公开(公告)日: | 2014-06-18 |
发明(设计)人: | 王凤玲;王田;吴文海;张德军 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L21/003 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多声道 语音 信号 调制 方法 装置 | ||
技术领域
本发明涉及通信技术领域,特别涉及一种多声道语音信号的时标调制方法和装置。
背景技术
在基于IP的语音通信系统中,会话双方所发出的话音被封装成IP数据包,并通过IP网络进行传输,然后,在接收端对该IP数据包进行解包并还原成语音,从而实现发送端、接收端双方的实时会话。
在基于IP的语音通信系统中,为了保证会话尽量以实时的方式进行,通常使用RTP(实时传输协议)传输协议,而不使用TCP(传送控制协议)协议。在基于IP的语音通信系统中,语音通常按ITU-T(国际电信联盟-电信标准部)建议的G.711、G.723或G.729标准进行编码,然后再进行传输。
目前基于IP的语音通信多是单声道的,自适应抖动缓冲管理(AJBM,adaptiVejitter buffer management)中的时标调制time scaling也是对单个声道进行扩展extend或者压缩compress,但是基于立体声或者多声道的新IP语音通信也在开始研究。
现有技术解决多声道time scaling声场改变的方法,就是通过寻找相同的语音信号扩展或者压缩的长度维持多声道声场的稳定。但是这种方式的主要问题是不能保证每个声道的相似段信号Similar Segment与各自声道的模板段信号Template Segment最相似的。因此,现有技术针对多声道语音信号的时标调制计算时不能保证各声道质量最优,容易产生失真的问题。
发明内容
有鉴与此,本发明的实施例提供了一种多声道语音信号的时标调制time scaling方法和装置,以实现在解决多声道语音信号声场稳定的同时,提供更好的声道质量。
本发明第一方面的实施例公开了一种多声道语音信号的时标调制time scaling方法,其特征在于,包括:获取多声道语音的输入信号以及相关的初始化信息,相关的初始化信息包括帧信号长度、每个声道初始的信号累计长度、时标调制time scaling模式,其中所述每个声道初始的信号累计长度为每个声道的全部帧的帧信号长度的和;
根据所述时标调制模式对所述多声道语音的输入信号做时标调制计算,得到每个声道时标调制后的信号,根据所述每个声道时标调制后的信号更新所述每个声道初始的信号累计长度,得到每个声道时标调制后的信号累计长度;
根据所述每个声道时标调制time scaling后的信号累计长度选择时标调制time scaling后最长的信号累计长度和最短的信号累计长度;
若所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值不大于预设长度阈值,则输出所述每个声道时标调制time scaling后的信号。
根据本发明实施例的多声道语音信号的时标调制time scaling的方法,能够在有效的解决多声道语音信号时标调制time scaling后声场改变问题的同时,保证各个声道时标调制time scaling后的信号质量仍然十分优良,从而使得多声道语音信号在时标调制time scaling后的信号质量在感知听觉上仍能保持较高水准。
在本发明第一方面实施例第一种可能实现的方式中,在所述在根据所述每个声道时标调制后的信号累计长度选择时标调制后最长的信号累计长度和最短的信号累计长度之后还包括:
若所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值大于预设长度阈值,则初始化时标调制time scaling次数值;
对所述时标调制time scaling后信号累计长度最长的或最短的声道做时标调制time scaling,更新所述每个声道时标调制time scaling后的信号,并更新所述每个声道时标调制time scaling后的信号累计长度,根据所述每个声道时标调制timescaling后的信号累计长度更新所述时标调制time scaling后信号累计长度最长的声道索引以及最长的信号累计长度和信号累计长度最短的声道索引以及最短的信号累计长度,所述时标调制time scaling次数值增加1,
重复本步骤直至所述时标调制time scaling后最长的信号累计长度和所述最短的信号累计长度的差值不大于预设长度阈值。
结合上述任意之一实施例的本发明第一方面实施例第二种可能的实现方式中,在所述时标调制time scaling次数值增加1之后,若所述时标调制time scaling次数值大于预设次数阈值,则输出所述每个声道时标调制time scaling后的信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210532027.6/2.html,转载请声明来源钻瓜专利网。