[发明专利]基于网络协议的低速语音编码方法无效
申请号: | 00126112.6 | 申请日: | 2000-08-19 |
公开(公告)号: | CN1338834A | 公开(公告)日: | 2002-03-06 |
发明(设计)人: | 潘胜昔;李英涛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04B14/02 | 分类号: | H04B14/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 协议 低速 语音 编码 方法 | ||
本发明涉及数字通信系统中数据编码方法,尤其是基于网络协议的低速语音编码方法。
在数字通信系统中,用以传输信息的信道带宽总是有限的,要在有限的带宽内尽可能多地增加系统容量或用户数,就必须提高信道带宽的利用率。采用低速语音编码对信源数据进行压缩是提高带宽利用率的重要手段。目前,低速语音编码方法以固定帧长为基础,基于IP(网络协议)传送的语音信号的数据报分割是以一帧或多帧语音的比特数为单位的。
基于固定帧长的单帧或多帧IP语音传送系统的工作流程如下:在发送端,当语音PCM(脉冲编码调制)信号输入后,首先确定语音性质,再根据语音性质和帧长确定编码速率并对其进行压缩编码,最后对压缩后的单帧或多帧语音编码TCP(传输控制协议)或UDP(用户数据报协议)打包和IP打包后,通过信道传送给接收端;在接收端,首先进行IP和TCP或UDP解包,然后判断数据包是否出错、丢包或延迟,如没有上述情况,则正常译码后输出语音PCM信号,否则,经单帧或多帧语音预测译码后输出语音PCM信号。在上述过程中,无论采用单帧还是多帧,由于采用了固定帧长,则其编码效率低,不利于编码效率的进一步下降。当采用多帧时,还不利于IP数据包丢失、传送比特出错、延迟太大时对信源译码的处理,对语音译码质量有影响。
针对以上现有技术中的问题,本发明的目的是,提供一种有利于提高编码效率、降低压缩速率、保证语音译码质量的基于网络协议的低速语音编码方法。
为达到上述目的,本发明采用的技术方案是:一种基于网络协议的低速语音编码方法,该方法包括以下步骤:
(1)信源根据语音数据采样频率,顺序输入量化的语音数据;
(2)根据TN时间内输入的语音数据确定语音的性质参数;
(3)根据上述步骤(2)得到的语音性质参数,确定语音后继处理的最佳帧长T;
(4)对最佳帧长T的语音数据进行压缩编码;
(5)对语音数据压缩编码后的数据比特,在利用TCP或UDP协议
打包和IP协议打包后,通过信道输出。
由于本方法采用变帧长语音压缩编码方法,可提高编码效率,有利于编码压缩速率的进一步下降,进而提高了数据传输效率。同时由于本方法采用单帧语音编码,在IP包数据丢失、传送比特出错、延迟太大时,有利于信源译码的处理,对语音译码有好处,进而保证了语音译码质量。采用非正式听音表明,使用本方法的数据编码压缩能力或在同等误码率上,以及在对语音译码能力方面,MOS分值提高0.1~0.2。
下面结合附图和实施例对本发明作进一步的详细说明。
图1是本发明的流程示意图;
图2是基于自适应变帧长变速率的单帧IP语音传送系统流程示意图;
图3是本发明的一个实施例系统逻辑示意图;
图4是本发明的基于自适应变帧长变速率的单帧IP语音传送系统实施例流程示意图。
本发明的原理描述如下,参考图1、2。信源输入为采样量化的语音数据,数据是根据采样率顺序输入的,语音性质确定模块根据每TN毫秒输入的数据,确定输入语音的性质参数。上述时间TN按照下述原则确定:首先编码效率、压缩率要尽可能高,其次延迟时间不能太长;经实验证明,5ms≤TN≤30ms时为最佳。根据语音性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,基本原则为:使输入语音满足短时特性不变,而可以分析的语音帧长尽量长,具体说,若语音的变化频度快,则帧长短,反之帧长长。最佳帧长T=T1,T2,...,TN,为一个有限集。对最佳帧长T的语音,再采用内部变速率算法对其进行压缩编码,输出压缩编码后的比特,其比特数NUM也是在一个有限集中,NUM=NUM1,NUM2,......,NUMM。对语音压缩编码后输出的NUM个比特利用TCP或UDP协议加上包头,比特数变为NUM_P,IP打包模块对NUM_P个比特再打包加上路由信息,得到NUM_IP个比特,由此,传送到接收方,接收方进行IP解包,TCP或UDP解包。在正常情况下,语音译码模块正常译码,但由于在传送过程中,可能会引入信道误码,传输延迟等情况,此时,由于只有一帧语音传送,语音译码模块可以很容易地处理传输中出现的问题。
编码的基本操作流程如下:
(1)信源输入为采样量化的语音数据,数据是根据采样率顺序输入的;
(2)语音性质确定模块根据每TN毫秒输入的数据确定输入语音的性质参数,根据语音的性质参数,即语音的变化频度确定输入语音后续处理的最佳帧长T,T=T1,T2,...,TN,为一个有限集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00126112.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:筒形线圈成形方法及专用模具
- 下一篇:止咳喘润肺膏及其制作方法