[发明专利]声学变焦有效
申请号: | 201980056985.0 | 申请日: | 2019-08-30 |
公开(公告)号: | CN112956209B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | C·郑;A·A·奈尔;A·赖特;S·K·纳亚尔 | 申请(专利权)人: | 斯纳普公司 |
主分类号: | H04R1/40 | 分类号: | H04R1/40;H04S7/00;G10L25/27;G10L15/24 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 李永敏;杨晓光 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学 变焦 | ||
执行声学变焦的方法开始于麦克风捕获与视频内容相关联的声学信号。波束成形器使用声学信号生成波束成形器信号。波束成形器信号分别对应于视频内容的图块。每个波束成形器分别指向每个图块的中心。使用波束成形器信号生成目标增强信号。目标增强信号与视频内容的变焦区域相关联。通过如下操作来生成目标增强信号:识别分别至少具有被包括在变焦区域中的部分的图块,选择与所识别的图块相对应的波束成形器信号,以及组合所选择的波束成形器信号以生成目标增强信号。组合所选择的波束成形器信号可包括:确定每个所识别的图块相对于变焦区域的比例;以及基于该比例来组合所选择的波束成形器信号以生成目标增强信号。本文描述了其他实施例。
优先权
本申请要求于2018年9月3日提交的序列号为201811032980的印度专利申请的优先权的权益,在此要求其每一个的优先权的权益,并且其每一个均通过引用整体并入本文。
背景技术
当前,许多消费电子设备适于捕获音频和/或视频内容。例如,用户可以在公共场合使用他的移动设备快速捕获视频。
在视频的播放期间,观看者可以放大感兴趣的区域以更大的格式看到所选择的感兴趣的区域。但是,如果捕获视频的环境嘈杂,则与视频中感兴趣区域有关的音频可能已被淹没。
附图说明
在不一定按比例绘制的附图中,相似的数字可以在不同的视图中描述相似的组件。具有不同字母后缀的相似数字可以代表相似组件的不同实例。在附图的图中,通过示例而非限制的方式示出了一些实施例,其中:
图1是根据一个示例实施例的用于在使用中执行声学变焦的系统的示例。
图2是示出根据一个示例实施例的图1的系统的更多细节的框图。
图3是根据一个示例实施例的系统的图2中的声学变焦控制器111的细节的框图。
图4A-D示出了根据本发明的实施例的视频内容上的图块(tile)的布置(图4A),图块的布置上的变焦区域(图4B)以及基于包括在变焦区域中的图块来组合波束成形器信号(图4C-4D)。
图5是根据一个示例实施例的系统的图2中的声学变焦控制器111的细节的框图。
图6示出了根据本发明的实施例的视频内容上的变焦区域和以变焦区域为中心的视场锥的示例。
图7是根据本发明的一个实施例的用于执行声学变焦的示例方法的流程图。
图8是根据本发明的一个实施例的用于执行声学变焦的示例方法的流程图。
图9是示出了可以与本文所述的各种硬件架构结合使用的代表性软件架构的框图。
图10是示出根据一些示例实施例的能够从机器可读介质(例如机器可读存储介质)读取指令并执行本文讨论的方法中的任何一个或多个的机器的组件的框图。
具体实施方式
以下描述包括体现本公开的说明性实施例的系统、方法、技术、指令序列和计算机器程序产品。在下面的描述中,出于解释的目的,阐述了许多具体细节以便提供对本发明主题的各种实施例的理解。然而,对于本领域技术人员显而易见的是,也可以在没有这些具体细节的情况下实践本发明主题的实施例。通常,众所周知的指令实例、协议、结构和技术不必详细示出。
本文所述的实施例通过允许在视频播放期间执行声学变焦来改进当前系统。具体地,声学变焦是指增强与视频中的感兴趣区域有关的音频。例如,当用户在播放期间在视觉上放大视频中的感兴趣区域时,可以在视觉上增强(例如,更大的格式)感兴趣区域,并且通过增大源自该感兴趣区域的音量,抑制源自该感兴趣区域之外的声音(例如,环境噪声,其他扬声器等),或其任何组合,同样可以增强与该感兴趣区域相对应的音频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯纳普公司,未经斯纳普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980056985.0/2.html,转载请声明来源钻瓜专利网。