[发明专利]改变回放速度或音调时处理音频信号中瞬态声音事件的设备和方法有效
申请号: | 201180023409.X | 申请日: | 2011-03-04 |
公开(公告)号: | CN102934164A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 萨沙·迪施;福雷德里克·纳格尔;斯特凡·维尔德 | 申请(专利权)人: | 弗兰霍菲尔运输应用研究公司 |
主分类号: | G10L21/038 | 分类号: | G10L21/038;G10L21/04 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;吴孟秋 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改变 回放 速度 音调 处理 音频 信号 瞬态 声音 事件 设备 方法 | ||
例如,借助于相位声码器,可在保持音调的同时改变音频信号的回放速度(例如,参见J.L.Flanagan和R.M.Golden,“贝尔系统技术期刊(The Bell System Technical Journal)”,1966年11月,1394-1509页;Laroche,J.和Dolson,M.的题为“相位声码器变调(Phase-vocoder pitch-shifting)”的美国专利第6,594,884号;Jean Laroche and Mark Dolson,“New Phase-Vocoder Techniques for Pitch-Shifting,Harmonizing And Other Exotic Effects”,Proc.1999IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,New Paltz,New York,Oct.17-20,1999)。以相同方式,采用该方法,可在保持原始回放持续时间的同时执行信号转换。保持原始回放持续时间通过回放由时间拉伸因子加速的拉伸信号来获得。在时间离散信号表示中,这对应于在保持采样频率的同时通过拉伸因子下采样信号。按照惯例,这种时间拉伸发生在时域中。可替代地,该时间拉伸也可发生在滤波器组内,诸如伪正交镜像滤波器组(pQMF)。伪正交镜像滤波器组(pQMF)有时也被称为QMF滤波器组。
拉伸中的具体挑战是在时间拉伸的处理步骤期间时间上“模糊”的瞬态事件。这由于诸如相位声码器的方法影响了所谓的信号的垂直相干性质(对于时间频率频谱图表示)而出现。
目前的一些方法更多在瞬态周围拉伸时间,以便不必在瞬态持续时间期间执行任何时间拉伸或仅执行很少的时间拉伸。例如,这已在以下文献中被描述:
-Laroche L.,Dolson M.:Improved phase vocoder timescalemodification of audio,IEEE Trans.Speech and Audio Processing,vol.7,no.3,pp.323-332
-Emmanuel Ravelli,Mark Sandler and Juan P.Bello:Fastimplementation for non-linear time-scaling of stereo audio;Proc.of the8th Int.Conference on Digital Audio Effects(DAFx’05),Madrid,Spain,September20-22,2005
-Duxbury,C.、M.Davies和M.Sandler(2001年12月)。使用多项分辨率分析技术分离音乐音频中的瞬态信息(Separation of transientinformation in musical audio using multi resolution analysis techniques)。数字音频效果COST G-6会议(DAFX-01)议事录(In Proceedings of the COSTG-6Conference on Digital Audio Effects),Limerick,爱尔兰。
另一篇有关该主题的论文由R,A.撰写:A NEW APPROACH TOTRANSIENT PROCES SING IN THE PHASE VOCODER;Proc.of the6thInt.Conference on Digital Audio Effects(DAFx-03),London,UK,September8-11,2003。
在利用相位声码器的音频信号的时间拉伸中,瞬态信号部分由于分散而“模糊”,因为信号频谱图中所谓的垂直相干性受到影响。利用所谓的交叠相加的方法来操作的方法可生成瞬态声音事件的伪前回声和后回声。通过在瞬态背景下改变时间拉伸、在实际瞬态期间无拉伸以及在周围更强拉伸,可处理这些问题。然而,若发生转换,则转换因子在瞬态背景下将不再恒定,即,叠加(可能为音调)信号部分的音调以伪可听方式改变。当时间拉伸在滤波器组(诸如pQMF)内发生时,会出现类似问题。
本申请领域涉及一种在这一过程内用于瞬态声音事件的听觉处理的方法。具体地,在时间拉伸的信号操作期间可去除瞬态声音事件。随后,在考虑拉伸的情况下,可执行未处理瞬态信号部分与改变(拉伸)的信号的精确拟合相加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司,未经弗兰霍菲尔运输应用研究公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180023409.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:中小型风力发电机组主动偏航控制系统
- 下一篇:一种多入多出天线装置