[发明专利]一种控制图像采集装置进行目标定位的系统及方法有效
| 申请号: | 200710104372.9 | 申请日: | 2007-05-10 |
| 公开(公告)号: | CN101068308A | 公开(公告)日: | 2007-11-07 |
| 发明(设计)人: | 叶茂林 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | H04N5/225 | 分类号: | H04N5/225;H04N5/232;H04N7/15;G10L15/00 |
| 代理公司: | 北京凯特来知识产权代理有限公司 | 代理人: | 郑立明 |
| 地址: | 518129广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 控制 图像 采集 装置 进行 目标 定位 系统 方法 | ||
技术领域
本发明涉及多媒体技术领域,尤其涉及一种控制图像采集装置进行目标定位的系统及方法。
背景技术
目前,可视电话、电话会议和视频会议等系统中广泛采用声源定位技术来控制摄像机对准正在说话的人。
比如,在多个人参加的会议中,基于声源定位技术的摄像机会可以根据声源的位置自动对准正在发言的人(如会场代表、汇报人等),但期间如果有其他人发出声音,将会导致摄像机转向发出声音的人,达不到期望的结果。
再比如,在多个人可发言讨论的会议中,我们期望讨论时优先对准参与讨论的专家,而基于声源定位技术的摄像机一般会对准声音强度大的说话人,如果讨论时专家的声音没有其他人大,摄像机就无法对准到专家身上。
总之,现有基于声源定位的摄像机无法满足多种场景的需要,如果要满足多种场景的需要,需要管理员手动遥控摄像机,操作维护很不方便。
发明内容
鉴于上述现有技术所存在的问题,本发明实施例提供了一种控制图像采集装置进行目标定位的系统及方法,通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而提高图像采集装置的操作维护性。
本发明实施例的目的是通过以下技术方案实现:
本发明提供了一种控制图像采集装置进行目标定位的系统,所述系统包括:
声源定位单元,用于根据接收到的多个声音信号进行定位,并将定位出的多个声源位置发送给应用层策略单元;
声音识别单元,用于根据接收到的多个声音信号与已保存的多个声音信号进行识别匹配,并将得到的多个声音识别结果发送给应用层策略单元;
应用层策略单元,用于根据多个声源位置、多个声音识别结果以及已保存的多个声音信号的优先级进行综合决策,得到图像采集装置的预期对焦位置,并将该预期对焦位置发送给图像采集控制单元;
图像采集控制单元,用于将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
本发明实施例还提供了一种控制图像采集装置进行目标定位的方法,所述方法包括以下步骤:
根据接收到的多个声音信号定位出多个声源位置;
将接收到的多个声音信号与已保存的多个声音信号进行识别匹配,得到多个声音识别结果;
根据所述多个声源位置及所述多个声音识别结果以及已保存的多个声音信号的优先级进行综合决策,得到图像采集装置的预期对焦位置;
将得到的图像采集装置的预期对焦位置与图像采集装置的当前对焦位置进行比较,并根据比较结果控制图像采集装置。
由上述本发明实施例提供的技术方案可以看出,本发明实施例提供了一种控制图像采集装置进行目标定位的系统及方法,通过声源定位和声音识别的结果来控制图像采集装置自动进行目标定位,从而达到提高图像采集装置的操作维护性。
附图说明
图1为本发明实施例的系统结构示意图;
图2为本发明实施例所述系统中的图像采集控制单元的结构示意图;
图3为本发明实施例所述方法的流程图。
具体实施方式
下面结合附图1和附图2对本发明实施例所述的声源定位系统进行详细说明。
附图1为本发明实施例的系统结构示意图,如图1所示,本发明实施例所述系统在具体实现过程中可以包括:声源定位单元、声音识别单元、应用层策略单元、图像采集控制单元,下面对各单元分别进行介绍。
声源定位单元:将其得到的外界的声音信号进行处理,定位出声源位置,并将声源位置发送给应用层策略单元,当所述声音信号为多个时,所述声源定位单元可以定位出多个声源位置,并将多个所述声源位置发送给应用层策略单元;所述声源定位的具体处理过程现在已有成熟解决方案,这里就不再赘述。
声音识别单元:根据其从得到的外界的声音信号和已保存的声音信号进行识别匹配,并将得出的声音识别结果发送给应用层策略单元,所述声音识别结果可以为,与预先设定的声音匹配,或者与预先设定的声音不匹配,或者没有匹配到预设定的声音,但是声音强度大的声源和上次不一样。当已保存的声音信号为多个时,所述声音识别单元可以得出多个声音识别结果。
应用层策略单元:根据从声源定位单元得到的声源位置和从声音识别单元得到的声音识别结果进行决策,得到所述决策结果为图像采集装置的预期对焦位置,然后将图像采集装置的预期对焦位置发送给图像采集控制单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710104372.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





