[发明专利]开环节距跟踪平滑有效
申请号: | 200680053928.X | 申请日: | 2006-10-27 |
公开(公告)号: | CN101506873A | 公开(公告)日: | 2009-08-12 |
发明(设计)人: | 杨高 | 申请(专利权)人: | 曼德斯必德技术公司 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L11/04;G10L19/00 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;于 静 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 开环 跟踪 平滑 | ||
相关申请
本申请基于通过援引整体结合于此的、申请日为2006年3月20日的 美国临时申请第60/784,384号,并且要求该临时申请的优先权。
技术领域
本发明主要涉及语音编码。具体而言,本发明涉及开环基音(pitch) 分析。
背景技术
语音压缩可以用来减少代表语音信号的位的数目,由此减少传输所需 带宽。然而,语音压缩可能造成解压语音的质量降级。一般而言,更高的 位速率将造成更高的质量而更低的位速率将造成更低的质量。然而,现代 语音压缩技术如编码技术可以在相对低的位速率产生相对高质量的解压 语音。一般而言,现代编码技术尝试代表语音信号对感知重要的特征而不 保存实际语音波形。习惯称为编码解码器的语音压缩系统包括编码器和解 码器并且可以用来减少数字语音信号的位速率。已经为语音编码解码器开 发许多算法,这些算法减少对原语音进行数字编码所需要的位的数目而又 尝试维持高质量的重建语音。
国际电信联盟电信部门(ITU-T)于1996年采用了称为G.729建议书 的长途质量语音编码算法,该建议书的标题为“Coding of Speech Signals at 8bits/s using Conjugate-Structure Algebraic-Core-Excited Linear-Predication(CS-ACELP)”,通过援引将该建议书整体结合于本申 请中。
图1图示了如其中说明的G.729建议书的CS-ACELP(共轭结构代数 -代码-激励-线性-预测)编码器100中的语音信号流。与图1中各块相邻的 标号表示G.729建议书内对各块的操作和功能进行描述的节编号。如图所 示,语音信号或者输入采样105进入高通和按比例缩减块(在G.729建议 书的第3.1节中有描述),其中在逐帧基础上向输入采样105施加预处理。 接着在逐帧基础上向预处理的语音信号施加LP分析115和开环基音搜索 120。如图1中所示在开环基音搜索120之后在逐帧基础上向语音信号施 加开环基音搜索125和代数搜索130,这样的结果是生成代码索引输出 135。
如图1中所示,开环基音搜索120包括在G.729建议书的第3.4节中 描述的查找开环基音延迟124。如其中说明的那样,为了减少搜索的复杂 度以求最佳自适应-代码簿延迟而将搜索范围限制于从开环基音分析中获 得的候选延迟Top。对每帧一次完成这一开环基音分析(10ms)。开环基 音估计使用来自计算加权语音122的加权语音信号sw(n)并且实施如下。
在第一步骤中在以下三个范围中:
i=1:80,...,143
i=2:40,...,79
i=3:20,...,39
查找三个相关最大值:
其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曼德斯必德技术公司,未经曼德斯必德技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680053928.X/2.html,转载请声明来源钻瓜专利网。