[发明专利]音频编码装置、解码装置、方法、电路及程序有效
申请号: | 201080003659.2 | 申请日: | 2010-10-21 |
公开(公告)号: | CN102257564A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 石川智一;则松武志;张国成;周欢;钟海珊 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;G10L21/04 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 编码 装置 解码 方法 电路 程序 | ||
技术领域
本发明大致涉及变换音频编码系统,尤其涉及使用时间规整(time warp)技术对输入音频信号的基音频率(pitch frequency)进行移动(shift),由此提高编码效率和音质的变换音频编码系统。另外,该音频编码系统不仅适用于音频,也能够适用于语音信号,能够在手机和电话电视会议中使用。
背景技术
变换编码技术是为了高效率地对音频信号进行编码而设计的。在人们的讲话中,信号的基本频率在时刻变化着。因此,语音信号的能量在较宽的频带中扩散。并且,尤其是在低比特率时,利用变换编解码器对基音变化的语音信号进行编码是低效率的。另外,例如在现有技术[3]、[4]中,采用时间规整技术来弥补基音变化的影响。
图10是表示对基本频率进行移动的概念的示例的图。
时间规整技术被用来实现基音移动。图10的(a)栏的频谱是原来的频谱,图10的(b)栏的频谱是进行基音移动后的频谱。
在图10的(b)栏中,基本频率从200Hz移动到100Hz。这样,将下一帧的基音移动成为与在前帧的基音一致,由此使基音变稳定。
图11是表示进行基音移动后的频谱的图。
因此,信号能量按照图11所示进行集中。
图11的(a)栏的信号是扫频(sweep)信号。并且,图11的(b)栏的信号是进行基音移动后的信号,(b)栏中的基音成为固定基音。
另一方面,图11的(c)栏的两个频谱是指信号(a)和信号(b)的频谱。在图11的(c)栏中表示信号(b)的能量被限制在狭小频带中。
在此,上述的基音移动是使用重采样(re-sampling)方法实现的。为了维持稳定的基音,重采样率按照基音变化率而变化。并且,通过适用基音跟踪算法,能够得到输入帧的基音轮廓。
图8是说明1音频帧的分段的图。
如图8所示,帧被分段成为基音跟踪用的较小的区段。另外,此时的邻接区段可以重叠。即,例如在至少一个组合中,该组合中的相互邻接的两个区段中的一个区段(的一部分)可以与另一个区段(的一部分)重叠。
并且,目前作为现有示例有基于自相关的基音跟踪算法[1]、和基于频域的基音检测方法[2]。
各个区段具有与该区段对应的基音值。
图15是表示基音轮廓的计算的处理的图。
图15的(a)栏的信号是具有随时间而变化的基音的信号。从信号的1区段计算出一个基音值。基音轮廓是指基音值的链。
在进行时间规整的期间,重采样率与基音变化率成比例。
基音变化信息是从基音轮廓中抽取的。
另外,在测定该基音变化率时频繁使用音分和半音。
图12是表示音分(cent)和半音的长度的图。音分是根据邻接基音的基音比(pitch ratio)计算得到的。
[数式1]
按照基音变化率,对时域信号进行重采样。其它区段的基音被移动成参照基音,并得到稳定的基音。例如,如果下一个区段的基音比在前基音高,则与这两个基音之间的音分的差分成比例地设定更低的重采样率。否则,采样率必须更高。
另外,在此假设为能够调整声音再现速度的记录再现装置,通过降低高音的声音的再现速度,将音域移动到低频。这和与基音变化率成比例地对信号进行重采样的概念相似。
图13和图14表示采用时间规整方式的编码系统。
图13是编码器(编码器13A)的时间规整的框图。
图14是解码器(解码器14A)的时间规整的框图。
在进行变换编码之前,时域信号被实施时间规整。在解码器的逆时间规整中需要基音信息。因此,基音比必须通过编码器进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080003659.2/2.html,转载请声明来源钻瓜专利网。