[发明专利]一种用于语音编码的固定码本搜索方法无效
| 申请号: | 200910097821.0 | 申请日: | 2009-04-20 |
| 公开(公告)号: | CN101866650A | 公开(公告)日: | 2010-10-20 |
| 发明(设计)人: | 陆铁根 | 申请(专利权)人: | 陆铁根 |
| 主分类号: | G10L19/08 | 分类号: | G10L19/08;G10L19/12 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 310003 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 语音 编码 固定 搜索 方法 | ||
技术领域
本发明涉及语音通信和存储领域,用于语音编码中固定码本的搜索,以提高编码的效率。
技术背景
语音编码广泛应用于有线/无线电话、视频会议、因特网电话(VoIP)、HDTV、高保真音乐等音频信号领域。目前,大多数低速率编码器都基于CELP技术,CELP编码技术是由Manfred R.Schroeder和Bishnu S.Atal于1985年ICASSP年会上首先提出的。CELP采用合成-分析搜索技术,尽管其需要大量的计算时间,但低速率高质量的特点,使其得到了广泛的应用。
原始语音通过短时预测分析,也叫线性预测分析(LPC),获得的残差信号的频谱特性与高斯随机信号类似,一个设计得当的大容量码本集,并搜索码本集中的最佳矢量作为激励信号源,仅用少量比特流就可以恢复原始语音信号。因此码本集的设计和搜索成为CELP编码器高质量和高效率的关键,近年来,一些优秀的编码器都对码本的设计和搜索进行了优化,一般采用代数码本结构(Algebraic code-excited linear prediction,ACELP),ACELP不需要存储码本,并能高效地搜索到最佳码矢,现在主流标准算法都采用ACLEP,如G.729、增强变速率编码器(EVRC)、可选模式声码器(SVM)、自适应多速率编码器(AMR)等,搜索代数码本一般采用最小均方误差算法作为搜索最佳码字矢量和增益的度量,如果通过全搜索方式搜索全局最优的脉冲位置和幅度的组合,计算量和复杂度都很高,如果采用某种贪心或优化算法就可以大幅减少计算量。
代数码本由一个脉冲幅度/位置组合的集合组成,每个脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合的各个位置的零幅脉冲和非零幅脉冲。每个非零幅脉冲有q种可能幅度。因此,最优码字矢量VC仅包含几个非零脉冲,VC可通过快速搜索方式获得。搜索最优码字矢量VC的方法一般通过把候选码字矢量作为激励源,使其与知觉加权滤波器H的单位冲击相应h(n)卷积所生成的信号与目标信号的误差平方最小,等价的方法是使候选码字矢量的度量QC最大,QC的计算公式如下:
其中,mi为第i个脉冲的位置,si是该脉冲的振幅(包含符号),Np是脉冲个数。
但是传统的固定码本搜索方法仍然占用了语音编码器的大量计算时间,导致整个编码器的效率降低,影响编码器的应用和推广。
发明内容
本发明的目的在于提供一种快速高效的固定码本搜索新方法,在保证质量的前提下,大幅降低码本搜索算法的复杂性和时间开销。
本发明的目的是通过如下措施来实现:提供了一种用于语音编码的固定码本搜索方法,其中,固定码本由一个A类子码本和多个B类子码本组成,一个子码本由多个轨道组成,当一个轨道分配多个脉冲时,该轨道复制为多个副本,保持一个轨道只存在一个脉冲;该固定码本的搜索方法采用目标信号矢量的热点集与码字矢量最大相关性方法,预先搜索最佳子码本及次优码字矢量,然后可采用最小平方误差的方式搜索与次优脉冲位置在同一轨道上的最佳脉冲,并用该脉冲替换原脉冲,以此在次优码字矢量的基础上进一步对码字矢量进行最优化搜索。
所述的A类子码本的脉冲(包括零/零非幅度)位置按列自上而下顺序排列;
所述的B类子码本脉冲位置按顺序和倒序相间的方式排序,奇数列从上而下排列,偶数列从下而上排列,脉冲(包括零/零非幅度)的起始位置偏移不同可生成多个子码本组成;
所述的最佳子码本的搜索步骤如下:
A)计算目标信号矢量热点集(F)中每个热点在各子码本中的坐标位置,即轨道号和位置索引,其中,目标信号矢量是自适应码本搜索后的残差信号和知觉加权滤波器的冲击响应的卷积;
B)搜索各子码本的每个轨道上的最佳热点位置索引;
C)计算各子码本所有轨道上的热点的振幅权值(w)之和(W);
D)选择权值之和(W)最大的那个子码本作为最佳码本(C);
所述的次优码字矢量的搜索步骤如下:
A)当最佳子码本(C)的某轨道中存在一热点时,把该热点位置索引作为该轨道的非零脉冲位置索引;
B)当最佳子码本(C)的某轨道中无热点位置索引时,选择该轨道所有位置中对应的目标信号振幅最大的位置作为非零脉冲位置索引;
C)最佳子码本(C)中所有轨道上的非零脉冲位置索引组成次优码字矢量(VC)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陆铁根,未经陆铁根许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910097821.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:影像感测器及镜头模组
- 下一篇:PT铁磁谐振的判别方法





