[发明专利]VoIP环境下基于G.711编码隐藏传送宽频语音的方法无效
申请号: | 200910031508.7 | 申请日: | 2009-04-22 |
公开(公告)号: | CN101604527A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 张格伟;承成;刘继明 | 申请(专利权)人: | 网经科技(苏州)有限公司 |
主分类号: | G10L19/14 | 分类号: | G10L19/14;H04M1/00;H04M3/00 |
代理公司: | 南京苏科专利代理有限责任公司 | 代理人: | 陈忠辉;姚姣阳 |
地址: | 215021江苏省苏州市工业园区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | voip 环境 基于 711 编码 隐藏 传送 宽频 语音 方法 | ||
技术领域
本发明涉及语音通讯中对声音信号处理和传输的方式,特别涉及VoIP环境下通过最普及的G.711编码在不增加数据量的情况下传送频率范围扩大一倍的宽带语音信号的方法。
背景技术
VoIP是指通过分组交换IP数据网络拨打电话的语音通信技术,其基本传输过程是声音经过模-数转换后,语音编码器将数字化的语音信号转化为比特流,比特流经过打包后通过IP网络传输,语音解码器利用接收的语音包,对语音信号进行重构,还原出原始语音信号。
语音编码算法是语音编码的核心组成部分,G.711是国际电信联盟(ITU-T)制定的目前使用最广泛的音频编码方式,在大多数VoIP系统中作为默认语音编码,其采样率为8k每秒,利用一个64kbps未压缩通道传输语音讯号。由于语音信号中存在着许多可被压缩的部分,其后又发展出许多新的编码,然而一种新的编码实施成本往往非常昂贵,加上G.711的MOS值仍然好于其它有损压缩编码,到目前为止,G.711仍然是使用最普遍的编码方式,兼容于大多数电话设备,尤其是无法通过软件升级来实现新的编码的硬件上。
受8k的采样频率限制,一般认为G.711的有效频率范围只有300Hz~3.4kHz,人类语言声的基音频率范围是100Hz-1kHz,泛音成分可达8kHz,而3.3kHz左右正好是人耳最敏感的频率范围,因此传统电话线路3.4kHz的频率限制使得语音中信息量相当丰富的一部分高频被截断。根据声学的研究可知,元音的频率范围集中在低频段,截断现象主要存在于辅音,例如/s/音和/f/音在3.4kHz以下的低频段很相近,在高频段才有区别,而电话线路只能传送低于3.4kHz的部分,因此使得电话中/s/音会被听成/f/音。如果对原始声音信号的采样频率提高到16k每秒,则可使声音的有效频率范围扩展到50Hz~7.0kHz,基本上涵盖了普通语音的频率范围,所带来的影响是原始采样点数据量增加了一倍,而语音质量大大提高,这就是所谓宽频语音,相对的,传统的PSTN线路称为窄频语音。由于宽频语音优良的频率特性,是语音通讯研究的热门课题。
为了传送宽频语音,已经发展出一系列相关标准如G.722,G.726,G.711.1等,但是目前应用情况并不理想,主要原因是新的编码对于系统改造所花的成本相当高,并且许多设备不能兼容。其中G.711.1是ITU-T于2008年3月发布的在G.711基础之上扩展的编码,其结构是前半段保留传统G.711编码,在后半段加上补充的低频扩展(50Hz~300Hz部分)和高频扩展(3.4kHz~7kHz部分),因此相应地码率也增加到64~90kbps,相对传统的PSTN线路来说,G.711编码已经接近极限,因此G.711.1难以兼容于传统通信环境中。
FFT(快速傅里叶变换)算法是一种常用的声音信号处理方法,可用来将声音由时域变换到频域,是一种可逆算法,并且可以由硬件加速,适合实时处理。IFFT是其反变换,可用于将频域信号变换回时域。如果频域信号未改变,反变换的结果与原始语音相同。
发明内容
本发明的目的是克服现有技术存在的不足,提供一种VoIP环境下基于G.711编码隐藏传送宽频语音的方法,使系统既能兼容于G.711编码,又能传送频率范围增加一倍的宽频语音信号,大大提升通话质量。
本发明的目的通过以下技术方案来实现:
VoIP环境下基于G.711编码隐藏传送宽频语音的方法,特点是:采用16k采样频率对声音信号进行采样,在语音包编码前进行前置处理,在频域上压缩处理,使其模拟成8k采样的传统电话语音信号的数据尺寸,然后用正常的G.711方式编码和发送,在接收端用反向算法进行解码和后置处理,获得原始语音信息。
进一步地,上述的VoIP环境下基于G.711编码隐藏传送宽频语音的方法,具体包含以下步骤——
①对语音信号进行16k采样,获得原始宽频信号;
②编码前置处理,对原始信号进行FFT变换,对频域信号进行非对称压缩处理,使数据减少一半;
③对处理过的信号进行FFT尺寸减少一半的IFFT变换,由频域变换回时域,然后按正常G.711编码方式进行编码,通过上层通信环境发送到受话方;
④在语音接收端建立接收数据缓冲区,对收到的语音包根据G.711编码进行解码,然后用半尺寸FFT变换到频域;
⑤对频域数据进行扩展,还原成全尺寸FFT数据,然后进行IFFT,变换回时域信号,等待播放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网经科技(苏州)有限公司,未经网经科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910031508.7/2.html,转载请声明来源钻瓜专利网。