[发明专利]用于活跃的说话者探测的视频和音频标记系统、方法及存储介质有效
申请号: | 201380066894.8 | 申请日: | 2013-12-19 |
公开(公告)号: | CN104937926B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | W.G.韦泰因;S.莱奥林 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王英 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 相机 视频会议系统 视频 视频信号 存储介质 音频标记 远程信号 阈值水平 说话 嵌入的 声音源 重定向 拾取 话筒 探测 发射 配置 | ||
1.一种用于视频会议系统的发射器系统,包括:
产生音频标记的标记产生器;
用于以下的组合器:将音频信号与所述音频标记组合以产出加标记的音频信号;
发射器,用于发射所述加标记的音频信号相对应的视频信号;以及
控制系统,其可操作以:
确定所述音频信号是否在阈值水平之上;
如果所述音频信号已经被确定为在阈值水平之上,则确定所述音频信号是否具有嵌入其中的音频标记;并且
如果所述音频信号已经被确定为不具有嵌入其中的音频标记,则使相机导向所述音频信号的源或者选择指向所述音频信号的源的相机,其中,所述相机产出所述相对应的视频信号。
2.根据权利要求1所述的发射器系统,并且进一步包括控制系统,其中所述控制系统将附加信息嵌入所述音频标记中。
3.一种用于操作视频会议系统的方法,所述方法包括:
接收音频信号;
接收相对应的视频信号;
产生音频标记;
确定所述音频信号是否在阈值水平之上;
如果所述音频信号已经被确定为在阈值水平之上,则确定所述音频信号是否具有嵌入其中的音频标记;并且
如果所述音频信号已经被确定为不具有嵌入其中的音频标记,则使相机导向所述音频信号的源或者选择指向所述音频信号的源的相机,其中,所述相机产出所述相对应的视频信号;
将所述音频信号与所述音频标记组合以产出加标记的音频信号;以及
发射所述加标记的音频信号和所述相对应的视频信号。
4.根据权利要求3所述的方法,其中存在多个接收到的音频信号,并且进一步包括选择不包含来自另一视频会议系统的音频标记的音频信号以用于组合。
5.根据权利要求3所述的方法,其中存在多个视频信号,并且进一步包括选择不包含来自另一视频会议系统的视频标记的视频信号以用于传输。
6.一种计算机存储介质,具有存储在其上的计算机可执行指令,当所述计算机可执行指令由计算机执行时,使得所述计算机:
确定接收到的音频信号是否在阈值水平之上;
如果所述接收到的音频信号已经被确定为在阈值水平之上,则确定所述接收到的音频信号是否具有嵌入其中的音频标记;并且
如果所述接收到的音频信号已经被确定为不具有嵌入其中的音频标记,则使相机导向所述接收到的音频信号的源或者选择指向所述接收到的音频信号的源的相机,其中,所述相机产出与所述接收到的音频信号相对应的视频信号;
产生音频标记;
将所述接收到的音频信号与所述音频标记组合以产出加标记的音频信号;以及
发射所述加标记的音频信号和相对应的视频信号。
7.根据权利要求6所述的计算机存储介质,其中,所述计算机存储介质进一步包括存储在其上、当由计算机执行时使得所述计算机在多个接收到的音频信号中探测来自远程视频会议系统的音频标记、并且选择不包含来自另一视频会议系统的音频标记的接收到的音频信号中的一个以作为待与所述音频标记组合的所述接收到的音频信号。
8.根据权利要求6所述的计算机存储介质,其中,所述计算机存储介质进一步包括存储在其上、当由计算机执行时使得所述计算机在多个接收到的视频信号中探测来自远程视频会议系统的视频标记、并且选择不包含视频标记的视频信号用以与所产生的音频标记组合的计算机可执行指令。
9.根据权利要求6所述的计算机存储介质,其中,所述计算机存储介质进一步包括存储在其上、当由计算机执行时使得所述计算机将附加信息嵌入所产生的音频标记中的计算机可执行指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380066894.8/1.html,转载请声明来源钻瓜专利网。