[发明专利]语音编码装置和语音编码方法有效

专利信息
申请号: 200580035271.X 申请日: 2005-10-25
公开(公告)号: CN101061533A 公开(公告)日: 2007-10-24
发明(设计)人: 押切正浩 申请(专利权)人: 松下电器产业株式会社
主分类号: G10L19/02 分类号: G10L19/02;H03M7/30
代理公司: 北京市柳沈律师事务所 代理人: 黄小临
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 编码 装置 方法
【说明书】:

技术领域

本发明涉及语音编码装置和语音编码方法。 

背景技术

在语音编码中,将时间信号变换到频域并对变换系数进行编码的变换编码,能够有效率地去除时间信号所包含的冗余性。另外,在变换编码,通过利用以频带表示的人的听觉特性,即使为低比特率,也能够实现难以感觉到量化失真的编码。 

近年来,在变换编码中,多利用被称为重叠正交变换(LOT;LappedOrthogonal Transform)的变换技术。这种技术是基于除了块内的正交性以外还考虑与相邻块之间的正交性的正交基,进行变换的技术,作为其代表的方法,可以举MDCT(Modified Discrete Cosine Transform)。在MDCT,以当前的分析帧和其前后的分析帧重叠的方式配置分析帧而进行分析。这时,变换后的系数中,只将分析长度的一半的系数作为编码对象即可,因此通过利用MDCT能够有效率地进行编码。并且,在合成时将当前帧与相邻的帧重叠相加,因此有以下特点,即,即使在对每个帧发生不同的量化失真的情况下,也难以发生在帧边界的间断。 

一般来说,在利用MDCT进行分析/合成时,将作为窗口函数的分析窗口和合成窗口分别与对象信号相乘。这时所使用的分析窗口/合成窗口与相邻帧重叠的位置的部分倾斜(slope)。该重叠区间的长度(即,斜坡长)与输入帧的缓存所需的延迟相当于因MDCT分析/合成而发生的延迟的长度。在双向通信中,如果该延迟变大,使得来自通信对方终端的响应达到本终端为止要费较长时间,无法形成流畅的会话。因此期望延迟尽量短。 

下面,说明现有的MDCT。 

在MDCT所使用的分析窗口/合成窗口,在满足式(1)所示的条件时,能够实现完全重构(在没有量化失真的前提下,变换造成的失真为0)。 

(式1) 

win(i)·wout(i)+win(i+N/2)·wout(i+N/2)=1 

(0≤i<N) 

作为满足式(1)的条件的有代表性的窗口,在非专利文献1提出了式(2)所示的正弦窗口。另外,图1是用图表示该正弦窗口的图。在使用这样的正弦窗口时,因为正弦窗口的谱特性能够充分的衰减旁瓣,所以能够以较高的精度分析频谱。 

(式2) 

w(i)=sin(N)]]>

(0≤i<N) 

另外,在非专利文献2提出了使用式(3)所示的窗口作为满足式(1)的条件的窗口,来进行MDCT分析/合成的方法。其中,N表示分析窗口的长度,L表示重叠区间的长度。另外,图2是用图表示式(3)所示的窗口的图。在使用这种窗口时,因为重叠区间为L,所以由该窗口产生的延迟表示为L。因此,通过将重叠区间L设定得短,能够抑制延迟的发生。 

(式3) 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200580035271.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top