[发明专利]用于话音活动检测的系统、方法和设备有效
| 申请号: | 201180051496.X | 申请日: | 2011-10-25 |
| 公开(公告)号: | CN103180900A | 公开(公告)日: | 2013-06-26 |
| 发明(设计)人: | 辛钟元;埃里克·维瑟;伊恩·埃尔纳恩·刘 | 申请(专利权)人: | 高通股份有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 话音 活动 检测 系统 方法 设备 | ||
根据35U.S.C.§119主张优先权
本专利申请案主张2010年10月25日申请且转让给本受让人的题为“用于减少噪音的双麦克风计算听觉场景分析(DUAL-MICROPHONE COMPUTATIONAL AUDITORY SCENE ANALYSIS FOR NOISE REDUCTION)”的临时申请案第61/406,382号的优先权。本专利申请案还主张2011年4月22日申请且转让给本受让人的题为“用于语音特征检测的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR SPEECH FEATURE DETECTION)”的美国专利申请案第13/092,502号(代理人案号100839)的优先权。
技术领域
本发明涉及音频信号处理。
背景技术
先前在安静的办公室或家庭环境中执行的许多活动现今正在如汽车、街道或咖啡馆的声学可变情形下执行。举例来说,某人可能想要使用话音通信信道与另一人通信。信道可(例如)由移动无线手持机或头戴式耳机、步话机、双向无线电、车载装置或另一通信装置提供。因此,在用户由其他人包围、伴有在人们倾向于集合时通常遇到的种类的噪音内容的环境中,大量话音通信正使用便携式音频感测装置(例如,智能手机、手持机和/或头戴式耳机)发生。这些噪音倾向于使在电话会话远端的用户分心或心烦。此外,许多标准自动化商务交易(例如,帐户结余或股票报价检查)使用基于话音辨识的数据询问,且这些系统的准确性可显著受到干扰噪音妨碍。
对于通信在噪音环境中发生的应用,可能需要将所需语音信号与背景噪音分离。可将噪音定义为干扰所需信号或以其它方式使所需信号降级的所有信号的组合。背景噪音可包含在声学环境(例如,其他人的背景会话,以及从所需信号和/或其它信号中的任何者产生的反射和回响)内产生的众多噪音信号。除非所需语音信号与背景噪音分离,否则可能难以对其进行可靠且有效率的使用。在一个特定实例中,语音信号在噪音环境中产生,且使用语音处理方法将语音信号与环境噪音分离。
在行动环境中遇到的噪音可包含多种不同分量,例如,竞争演说者、音乐、乱哄哄的声音、街道噪音和/或机场噪音。因为这些噪音的特征通常不静止且接近于用户自身的频率特征,所以噪音可能难以使用传统单一麦克风或固定波束成形型方法来模型化。单麦克风噪音减少技术通常需要显著的参数调谐以实现最佳性能。举例来说,在这些情况下,合适的噪音参考可能不直接可用,且可能有必要间接导出噪音参考。因此,可能需要基于多个麦克风的先进信号处理来支持在噪音环境中将移动装置用于话音通信。
发明内容
根据一般配置的一种处理音频信号的方法包含基于来自音频信号的第一多个帧的信息计算第一话音活动量度的一系列值。此方法还包含基于来自音频信号的第二多个帧的信息计算与第一话音活动量度不同的第二话音活动量度的一系列值。此方法还包含基于第一话音活动量度的所述系列值计算第一话音活动量度的边界值。此方法还包含基于第一话音活动量度的所述系列值、第二话音活动量度的所述系列值和第一话音活动量度的计算出的边界值产生一系列组合话音活动决策。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征致使所述机器读取所述特征以执行此方法。
根据一般配置的一种用于处理音频信号的设备包含用于基于来自音频信号的第一多个帧的信息计算第一话音活动量度的一系列值的装置,以及用于基于来自音频信号的第二多个帧的信息计算与第一话音活动量度不同的第二话音活动量度的一系列值的装置。此设备还包含用于基于第一话音活动量度的所述系列值计算第一话音活动量度的边界值的装置,和用于基于第一话音活动量度的所述系列值、第二话音活动量度的所述系列值和第一话音活动量度的计算出的边界值产生一系列组合话音活动决策的装置。
根据另一一般配置的一种用于处理音频信号的设备包含:第一计算器,其经配置以基于来自音频信号的第一多个帧的信息计算第一话音活动量度的一系列值;以及第二计算器,其经配置以基于来自音频信号的第二多个帧的信息计算与第一话音活动量度不同的第二话音活动量度的一系列值。此设备还包含:边界值计算器,其经配置以基于第一话音活动量度的所述系列值计算第一话音活动量度的边界值;以及决策模块,其经配置以基于第一话音活动量度的所述系列值、第二话音活动量度的所述系列值和第一话音活动量度的计算出的边界值产生一系列组合话音活动决策。
附图说明
图1和2展示双麦克风噪音抑制系统的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180051496.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:外置式花盆自动供水器
- 下一篇:用于检查物质的设备和方法





