[发明专利]用于群组声音远程通信的方法和装置有效
申请号: | 200780053043.4 | 申请日: | 2007-05-22 |
公开(公告)号: | CN101690149A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | P·桑德格伦;A·埃里克森;T·法尔克 | 申请(专利权)人: | 艾利森电话股份有限公司 |
主分类号: | H04M3/56 | 分类号: | H04M3/56;H04N7/15;H04S3/00 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王 岳;李家麟 |
地址: | 瑞典斯*** | 国省代码: | 瑞典;SE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 声音 远程 通信 方法 装置 | ||
技术领域
本发明一般涉及用于群组声音远程通信的方法和设备,并具体涉及与感觉 到的声音方向关联的这样方法和设备。
背景技术
在当今很多电信系统中,提供了不同种类的远程电话会议服务。在远程电 话会议会话中,多于两方可以同时参与,并以任何方向交换信息。一般努力是 提供尽可能接近于真实世界的会议的通信情景。
在真实世界的会议中,参与者通常围坐在桌子旁,当有人讲话时,其余参 与者通常转头朝向发言者以便看着发言者以及使语音到达各自的耳朵的相关性 最大化。这使得信噪比最大化。当同时有超过一个人在讲话时,人的听觉系统 能够利用声音的空间分布并区分来自不同源的的语音,并且如果希望的话将听 力集中到某人。这种现象被称为鸡尾酒会效应。
然而,在最常用的远程电话会议系统中,单个麦克风捕获在不同位置的不 同参与方的语音,并在将信号返回送到参与方之前将信号相加起来,并且通过 扬声器或者耳机播放。收听这个信号的人在判断是谁在讲话并且是否几个人同 时在讲话上有问题,将很难区分来自不同讲话者的声音。不同声音的来源都表 现出具有相同的空间定位,例如扩音器的位置。
在远程电话会议中加入视频使认定谁在讲话变得容易,但是当多人同时讲 话时问题仍然存在。现有技术中对此常用的解决方法是三维定位音频,使用户 能够以类似于真实会议的方式感知到声音,即听出到声音源的方向和距离。当 三维(3D)音频正确地用于远程电话会议中时,通过位于不同位置的所有参与 方或者参与者再现虚拟房间。
在虚拟3D音频远程电话会议中定位参与者的直接解决方法是使他们均匀 地分散于圆桌周围,就像通常在真实世界中那样。然后为了模拟发言者相对于 聆听者的相对位置,各个发言者的语音信号被3D再现。某个参与者的相对位置 与其他所有参与者都不同,但是绝对位置将正好与真实世界的会议的情景相同。
将虚拟人定位在圆桌周围在很多方面很好反映了真实会议,除了在虚拟远 程电话会议中聆听者通常不能够转头朝向发言者。这将导致紧挨着聆听者的参 与者在很远一边被收听到。这种情况不像真实会议,因此感觉不舒服。
显而易见的解决方法当然是使聆听者头部转动影响3D再现,像真实会议 一样。然而,这要求必须将头部转动参数发送给远程电话会议再现器。为此, 聆听者必须是活动的,无论何时新的参与者开始发言就要转动虚拟头部。集中 于转动虚拟头部可能在会议期间将从发言者正在说的内容偷偷移动注意力。另 一种解决方法是自动提供真实头部方向的量度,将这样的坐标提供给远程电话 会议再现器。然而,这种设备必须结合高级的定位设备。
发明内容
本发明的一般目的是以聆听者更友好的方式提供表现在感觉上空间分离的 声音源的群组声音远程通信服务。
上述目的通过根据随附权利要求的方法和装置来实现。一般而言,在第一 方面,提出了在群组声音远程通信期间的音频场景管理的方法,在该群组声音 远程通信中至少第一发射方、第二发射方和接收方参与。该方法包括接收表示 第一发射方的声音和第二发射方的声音的信号,将接收到的信号处理成处理过 的信号,这样以致于接收方感觉来自第一发射方的声音好像是从第一角度发出 的,而来自第二发射方的语音感觉好像是从第二角度发出的。角度是相对于接 收方来定义。第二角度不同于第一角度。该方法还包括分别地获取第一和第二 发射方的声音活跃性的量度,并基于所获取的声音活跃性的量度调整第一角度 和/或第二角度。最后,输出表示处理过的信号的信号。
在第二方面,音频场景管理器设备包括接收器,用于接收表示至少群组声 音远程通信的第一发射方的声音和该群组声音远程通信的第二发射方的声音的 信号。音频场景管理器设备还包括连接到该接收器的处理器。该处理器被配置 用于将接收的信号处理成处理过的信号,这样以致于接收方感觉来自第一发射 方的声音好像是从第一角度发出的,而来自第二发射方的声音感觉好像是从第 二角度发出的。该角度相对于接收方来限定。第二角度不同于第一角度。音频 场景管理器设备还包括用于分别地获取第一和第二发射方的声音活跃性量度的 装置,该装置连接到处理器。该处理器被设置用于基于所获取的声音活跃性量 度来调整第一角度和/或第二角度。音频场景管理器设备还包括连接到该处理器 用于表示处理过的信号的信号的输出。
在第三方面,电话终端包括根据第二方面的音频场景管理器设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾利森电话股份有限公司,未经艾利森电话股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780053043.4/2.html,转载请声明来源钻瓜专利网。