[发明专利]多通道音频中语音相关通道的缩放回避的方法和系统有效
申请号: | 201180012782.5 | 申请日: | 2011-02-28 |
公开(公告)号: | CN102792374A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | H·缪施 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;H04R5/04;H04S3/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 冯玉清 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通道 音频 语音 相关 缩放 回避 方法 系统 | ||
相关申请的交叉引用
本申请要求2010年3月8日提交的美国专利临时申请No.61/311,437的优先权,其整体通过引用合并于此。
技术领域
本发明涉及用于改善由多通道音频信号确定的人类语音(例如对话)的可辨识度的系统和方法。在一些实施例中,本发明是一种方法和系统,其通过确定指示由语音通道确定的语音相关内容与由非语音通道确定的语音相关内容之间的相似程度的至少一个衰减控制值,并响应于该衰减控制值对该非语音通道进行衰减,来对具有语音通道和非语音通道的音频信号进行滤波以改善由信号确定的语音可辨识度。
背景技术
贯穿本公开,包括在权利要求书中,术语“语音”用于广义上指示人类语音。因此,由音频信号确定的“语音”是指信号中在由扬声器(或其他发声换能器)再现信号时感知为人类语音(例如对话、独白、歌声或其他人类语音)的音频内容。根据本发明的典型实施例,由音频信号确定的语音的可听度相对于由信号确定的其他音频内容(例如乐器音乐或非语音声音效果)得到改善,由此改善语音的可辨识度(例如,清楚性或理解容易度)。
贯穿本公开,包括在权利要求书中,多通道音频信号中的一通道的“语音增强内容”这一表述是指增强由信号的另一通道(例如语音通道)确定的语音内容的可辨识度或其他感知品质的内容(由该通道确定)。
本发明的典型实施例假定多通道输入音频信号确定的语音的大部分由信号的中央通道确定。该假定与环绕声音产品惯例一致,根据该惯例,大部分语音通常置于仅一个通道(中央通道)中,大部分音乐、环境声音和音效通常混合到所有通道中(例如左通道、右通道、左环绕通道和右环绕通道以及中央通道)。
因此,多通道音频信号的中央通道将有时在这里称为“语音”通道,信号的全部其它通道(例如左通道、右通道、左环绕通道和右环绕通道)有时在这里称为“非语音”通道。类似地,由立体声信号的左和右通道之和产生的“中央”通道(其语音被移位到中央)有时在这里称为“语音”通道,通过从立体信号的左(或右)通道减去这样的中央通道而产生的“侧”通道将有时在这里称为“非语音”通道。
贯穿本公开,包括在权利要求书中,“对”信号或数据进行操作的表述(例如对信号或数据进行滤波、缩放或变换)用于广义上指示直接对信号或数据进行操作,或者对信号或数据的处理变体(例如,在对其执行操作之前已经经历了初步滤波的信号变体)执行操作。
贯穿本公开,包括在权利要求书中,表述“系统”用于广义上指示器件、系统或子系统。例如,实现解码器的子系统可以称为解码器系统,包括这样的子系统的系统(例如,响应于多个输入产生X个输出信号的系统,其中该子系统产生M个输入,其它X-M个输入从外部源接收)也可以称为解码器系统。
贯穿本公开,包括在权利要求书中,第一值(“A”)对第二值(“B”)的“比”这一表述广义上用于表示A/B、或B/A、或A和B之一的缩放或偏移变体对A和B中的另一个的缩放或偏移变体的比(例如(A+x)/(B+y),其中x和y表示偏移值)。
贯穿本公开,包括在权利要求书中,信号通过发声换能器(例如扬声器)的“再现”这一表述表示使换能器响应于信号产生声音,包括通过进行任何所需的放大和/或其它信号处理。
当在存在竞争声音的情况下听语音时(诸如在餐馆中克服人群噪声倾听朋友说话),指示语音的音素内容的部分声学特征(语音提示 (speech cue))被竞争声音所掩盖且不再可用于倾听者来解码讯息。随着竞争声音的水平相对于语音水平升高,正确接收的语音提示的数量降低且语音感知逐渐变得更难,直到在某竞争声音水平下,语音感知过程中断。虽然这种关系对于所有倾听者有效,但是对于任意语音水平而言能容忍的竞争声音水平对于所有倾听者并不相同。有些倾听者,例如由于年老而损失听力者(老年聋)或倾听青春期之后学会的语言者,与具有良好听力或运用母语的倾听者相比,更不能容忍竞争声音。
存在竞争声音时倾听者理解语音的能力不同的事实暗示了新闻或娱乐音频中环境声音和背景音乐与语音混合的水平。损失听力或运用外语的倾听者通常喜欢与内容产生者所提供的相比相对更低水平的非语音音频。
为了迎合这些特殊需要,已知对多通道音频信号的非语音通道应用衰减(回避),而更小(或没有)衰减应用到信号的语音通道,以改善信号所确定的语音的可辨识度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180012782.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种教案摆放装置
- 下一篇:用于计算机辅助地控制和/或调节技术系统的方法