[发明专利]用于活跃的说话者探测的视频和音频标记系统、方法及存储介质有效
申请号: | 201380066894.8 | 申请日: | 2013-12-19 |
公开(公告)号: | CN104937926B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | W.G.韦泰因;S.莱奥林 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王英 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 相机 视频会议系统 视频 视频信号 存储介质 音频标记 远程信号 阈值水平 说话 嵌入的 声音源 重定向 拾取 话筒 探测 发射 配置 | ||
描述了一种视频会议系统,其被配置成选择活跃的说话者而避免错误地选择正在拾取来自于连接的远程信号的音频或视频的话筒或相机。做出音频信号是否在阈值水平之上的确定。如果是,则做出关于该音频信号中是否存在标记的确定。如果是,则忽略该信号。如果不是,相机被导向由音频信号所识别的声音源。做出来自该相机的视频信号中是否存在标记的确定。如果是,重定向相机。如果不是,(多个)本地标记被插入音频信号和/或视频信号中。发射(多个)加标记的信号。因此,系统将忽略具有来自另一视频会议系统的嵌入的标记的声音或视频。
背景技术
视频会议已经变得普遍,并且许多办公室具有特别配置用于视频会议会话的房间。这样的房间通常包含视频会议设备,诸如一个或多个可移动相机和一个或多个话筒,话筒通常放置在房间中用于参与者的桌子周围的位置处。活跃的(active)说话者探测(ASD)经常用于选择相机,或者移动(摇摄和/或倾斜)相机以示出房间中正在说话的人员和/或选择将活跃的话筒。当远程人员在说话时,他们的图像和/或声音从房间中诸如电视机(TV)、监控器或其他类型显示器的音频-视频显示器发出。这可能引起ASD错误地选择关于TV上的正在讲话的远程人员的图像,而不是选择最后的正在讲话的本地人员。
而且,在多地点视频会议会话中,其中三个或更多个分离的地点处于单个视频会议会话中,则通常将显示数个面板,一个面板比其他面板更大并且示出正在说话的人员,以及其他面板示出来自其他地点处相机的图片。当发生错误的ASD时,如上所提到的,其中人员正在说话的房间中的装备将发送信号至其他地点处的装备,告知在其地点处的人员正在说话,并且因此主显示应当来自其相机。当发生该情形时,较大的面板可能从示出实际上正在说话的人员切换至示出TV屏幕或空座椅的图片。因此,关于ASD的问题在于,如果来自远程视频会议系统的声音被反射或如此响亮以致使其触发了ASD,则远程声音可能被转发回至远程系统和/或使得本地相机聚焦在空座椅或者示出远程视频会议地点的显示屏上。
已经用于消除这样的错误ASD选择的一种技术是认出在TV上追踪的图像扫描线以确定声音是来自TV而不是本地人员。然而,高清晰度TV(HDTV)具有高(240Hz或更佳)逐行扫描速率和与相机相等的图像分辨率,因此当牵涉HDTV时图像扫描线追踪的使用受限。额外地,ASD可能常具有房间周围的回声方面的麻烦。诸如窗户或玻璃覆盖的图片的声音反射性表面可以以声音看似源自桌子处的本地人员的方式而反射来自于TV的声音,即便并不实际存在坐在桌子的该位置处的人员。进一步地,如果对视频会议做记录,则其依赖于人记住至少用例如视频会议的日期来对记录进行准确地标注。这常被忘记并且之后完成,有时带有错误或不完整的标注。正是关于这些和其他考虑而呈现本文做出的公开。
发明内容
本文描述用于视频会议系统的技术,其选择活跃的说话者同时避免错误地选择拾取来自于连接的远程信号的音频或视频的话筒或相机。在一个实施方式中,标记被添加至流出的音频和/或视频信号。如果话筒拾取了包含来自远程系统的标记的声音,则忽略该声音并且不实施ASD。如果声音不包含远程标记,则检查来自本地相机的视频。如果其包含远程标记,则不实施ASD。如果任一信号中不存在远程标记,则实施ASD。
根据本文呈现的一个实施例,用于视频会议系统的发射器系统具有用于产生音频标记或视频标记中的至少一个的标记产生器;用于以下二者中的至少一个的信号组合器:(i)将接收到的音频信号与音频标记组合以产出加标记的音频信号或(ii)将接收到的视频信号与视频标记组合以产出加标记的视频信号;以及发射器,用于发射(i)加标记的音频信号和接收到的视频信号、(ii)接收到的音频信号和加标记的视频信号、或者(iii)加标记的音频信号和加标记的视频信号。然后远程视频会议系统可以使用嵌入的标记来区分本地的声音和图片与远程的声音和图片。
一种用于操作视频会议系统的发射器的方法包括:接收音频信号,接收视频信号,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380066894.8/2.html,转载请声明来源钻瓜专利网。