[发明专利]用于汽车的驾驶者声源定位系统及方法有效
申请号: | 201210285704.9 | 申请日: | 2012-08-10 |
公开(公告)号: | CN102819009A | 公开(公告)日: | 2012-12-12 |
发明(设计)人: | 冯雁;黄石磊;李恬 | 申请(专利权)人: | 汽车零部件研究及发展中心有限公司 |
主分类号: | G01S5/18 | 分类号: | G01S5/18;G10L11/00 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 徐丁峰;李直 |
地址: | 中国香港九龙达*** | 国省代码: | 中国香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 汽车 驾驶者 声源 定位 系统 方法 | ||
技术领域
本发明涉及汽车电子领域,特别涉及一种用于汽车内的声源定位系统及方法。
背景技术
随着科技的发展,越来越多的设备和应用已经逐渐配备在汽车中,例如导航系统、影音播放系统等等。然而,驾驶者如果在行驶过程中需要使用这些设备,则不得不暂时离开方向盘去进行操控,为驾驶者带来了潜在危险性和不便。为了降低驾驶者在开车过程中需要用手控制所有操控界面而离开方向盘的潜在危险性,声控系统成为了近年来诸多车用电子系统研发的重点。声控系统的目的是期望让驾驶或用车者以轻松自然的说话方式,通过电脑系统的判读,达到控制的目的。
在现有声控系统的技术中已经使用了由驾驶者佩戴耳机麦克风来进行操控的方法,来腾出驾驶者的双手。然而,佩戴耳机麦克风为驾驶者带来了一定的不便。例如,驾驶者如果忘记在行驶前佩戴,则就无法在行驶中进行操控。另外,如果佩戴的耳机麦克风由于遭遇路况颠簸而在驾驶过程中脱落,也会为驾驶者带来不便。此外,耳机麦克风的定期维护保养也会为驾驶者带来额外的行车成本,造成不便。因此,对于驾驶者非入侵式的方法将是一种较好的选择。
声源定位,即ASL技术是确定一个声源在空间中的位置。该方法通常是基于多个麦克风构成的阵列来处理信号。麦克风阵列接收到语音信号并进行处理,从而确定及跟踪说话人的位置。目前该项技术已经在视频会议、电话会议、智能机器人、语音检测和语音识别等场合中得到了广泛的应用。
常规的ASL方法利用麦克风阵列来获取语音的多个信道。由于麦克风处于不同位置,通过比较这些语音信道的特征差异来估计方向并最终判断语音源的真实位置,从而实现ASL。例如,到达时差方法(TDOA)方法利用时间差,波束形成方法利用相位差,和能量比较方法利用能量差等等。这些方法中,更常用的是TDOA和波束形成方法。空间上分离的麦克风接收不同时延的语音,并由TDOA利用互相关函数进行计算。之后提出了一些改进的算法,如具有相位改变的广义互相关函数(GCC-PHAT)、互功率谱相位(CSP)分析等等。这些方法需要相关的语音和不相关的噪音,因此最好有清晰语音。ASL中使用的波束形成是一种窄频带能量接收应用。如果预期的信号和干扰噪音占据相同的频带,则无法提取信道间的空间传播关系。用于定位的能量比较算法总是限于在大规模传感器网络内使用,因为在传播过程中能量迅速降低,并且更大的搜寻空间需要更多的传感器。然而,这一算法能够减少计算负担和麦克风之间的精确时间同步负担,在实时系统中表现出优势。
然而,当将传统的声源定位技术应用到车内驾驶员定位的场合中时,遇到了很多问题。首先,麦克风阵列的尺寸和价格均限制了其在汽车上的应用。在车内有限的空间内,不可能配置大量麦克风构成的麦克风阵列来进行精确定位。同时声音的波长较长,对相位比较敏感,在麦克风阵列中要求阵元麦克风相位响应严格同步,成本上很高。此外,汽车环境中的噪音是特殊的。由于背景噪音、语音信号反射、引擎震动和设备噪音,噪音水平非常高,以致其对语音信号处理产生极大的负面影响。因此,需要较高的硬件成本和软件算法开销来进行定位计算。因而无法实现实时、快速、准确的驾驶者定位。
因此,需要一种改进的对驾驶者进行声源定位的方法及系统,具有相对低廉的成本,同时兼有高度的定位准确性和实时性。
发明内容
根据本发明的一个方面,提供了一种用于汽车的驾驶者声源定位系统,所述系统包括:位于不同位置处的第一语音采集装置和第二语音采集装置,用于采集第一语音信号和第二语音信号;控制系统,用于将所述第一语音信号和第二语音信号分别进行处理以输出驾驶者定位信息,所述控制系统进一步包括:降噪装置,用于对所采集的第一和第二语音信号进行降噪处理;滤波装置,用于对经过降噪处理的第一和第二语音信号进行滤波;语音激活检测装置,用于分别选择滤波后的语音信号中所需的部分,并将选择的结果进行合并;长帧分帧装置,用于对合并后的语音信号各自分别按照时长划分为若干个帧;包络计算装置,分别计算经所述语音激活检测装置选择后的第一和第二语音信号的信号包络和包络能量;以及能量比率计算装置,根据所述包络计算装置和长帧分帧装置的计算结果,计算所述第一和第二语音信号的包络能量比率。
优选地,所述第一语音采集装置位于所述汽车内靠近驾驶员的位置处,所述第二语音采集装置位于偏离驾驶员的位置处。
优选地,所述第一语音信号为所述驾驶员的语音信号,所述第二语音信号为与所述第一语音信号不同的对比信号。
优选地,所述第一语音采集装置和第二语音采集装置是麦克风。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汽车零部件研究及发展中心有限公司,未经汽车零部件研究及发展中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210285704.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸防护型蹦床
- 下一篇:一种智能灭火装置启动探测器