[发明专利]用于鲁棒语音活动检测的方法和装置无效
申请号: | 200780046060.5 | 申请日: | 2007-10-24 |
公开(公告)号: | CN101573749A | 公开(公告)日: | 2009-11-04 |
发明(设计)人: | 杜尚·马乔 | 申请(专利权)人: | 摩托罗拉公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02;G10L21/02 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 刘光明;穆德骏 |
地址: | 美国伊*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 活动 检测 方法 装置 | ||
技术领域
[0001]本发明涉及电子设备中的语音检测。
背景技术
[0002]许多语音相关技术和系统,例如自动语音识别(ASR)、语音编码、说话人识别/验证等的效果在很大程度上依赖于区别语音和噪声(或通常的非语音)的能力。在ASR系统中,系统区分语音和非语音的能力对嘈杂环境中语音识别的精确度有强烈的影响。例如,影响识别的噪声可以是来自用户周边的环境和声学背景噪声,或者是通信系统本身产生的电子性质噪声。这种噪声影响众多依赖语音识别的电子设备,例如汽车中的全球定位系统(GPS)、声控电话及立体声系统等等。例如,在驾驶情形下,如果人们在交谈,立体声系统开启,和/或车窗放下,那么传统的语音识别系统区分语音和背景噪声将变得困难。
发明内容
[0003]本发明公开了一种用于鲁棒语音活动检测的方法和装置。该方法可以包括:通过使用排序统计滤波对输入信号进行滤波来计算自相关;在一时间段内对该自相关进行平均;从平均的自相关中获取浊音语音特征;基于所获取的浊音语音特征将输入信号分类为语音和非语音之一;并且仅将分类的语音信号,或者将输入信号连同语音/非语音分类信息一起输出到自动语音识别器。
附图说明
[0004]为了对可以通过其获得本发明前述以及其他优势和特点的方式进行阐述,这里将通过参照特定实施例来呈现对以上简要描述的本发明的更具体的描述,这些特定实施例由附图说明。应当理解的是这些附图仅仅是本发明的典型实施例,并且因此不被认为是对本发明范围的限制,下面将通过使用附图,利用附加的特征和细节来描述和解释本发明:
[0005]图1示出了依照本发明可能的实施例的在通信网络中操作的鲁棒语音活动检测器的示例性示图;
[0006]图2示出了具有依照本发明可能的实施例的鲁棒语音活动检测器的示例性无线通信设备的方框图;
[0007]图3是示出依照本发明一个可能的实施例的一个可能的鲁棒语音活动检测过程的示例性流程图。
具体实施方式
[0008]本发明的其他特征和优势将在之后的描述中被阐明,并且这些特征和优势通过描述部分地将变得显而易见,或者可以通过本发明的实践被了解。通过所附权利要求所特别指出的器具和组合,可以实现和获得本发明的特征和优势。根据随后的描述和所附权利要求本发明的这些和其他特征将变得更加显而易见,或者通过即将在这里被阐明的本发明实践,可以了解本发明的这些和其他特征。
[0009]下面详细讨论本发明的多种实施例。虽然讨论了特定的实施方式,但是应当理解这只是出于说明的目的。相关领域技术人员将认识到,在不脱离本发明精神和范围的前提下,可以使用其他组件和配置。
[0010]本发明包括多种实施例,例如与本发明基本概念相关的方法、装置以及其他实施例。
[0011]本发明涉及基于浊音语音检测过程的鲁棒语音活动检测。本发明背后的主要动机和假设为:
——噪声环境中,语音的周期性浊音部分非常强健;
——许多实际噪声并不表现出周期性行为。
[0012]作为结果,在波形片段中典型的人基本频率F0(也被称为基音(pitch))的范围之内的周期性的量将指示语音存在或不存在,并且因此为许多实际噪声情况提供了鲁棒特征。
[0013]图1示出了依照本发明可能的实施例的在通信网络环境100中操作的鲁棒语音活动检测器120的示例性示图。特别地,所述通信网络环境100包括通信网络110、无线通信设备140、通信服务平台150以及耦合到无线通信设备120的鲁棒语音活动检测器130。通信网络110可以代表本领域技术人员所公知的任何网络,包括无线电话网络、蜂窝网络、有线电话网络、因特网、无线计算机网络、企业内部互联网、卫星无线电网络等。无线通信设备120、140可以代表无线电话、有线电话、个人计算机、便携式无线电装置、个人数字助理(PDA)、MP3播放器、卫星无线电装置、卫星电视、全球定位系统(GPS)接收机等。
[0014]通信网络110可以允许无线通信设备120与其他无线通信设备,例如无线通信设备140进行通信。可选择地,无线通信设备120可以通过通信网络110向通信服务平台150通信,所述通信服务平台可以向GPS设备、卫星无线电装置、MP3播放器、PDA、无线电装置、卫星电视等提供诸如媒体内容、导航、目录信息等的服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩托罗拉公司,未经摩托罗拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780046060.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:开关锁定装置
- 下一篇:连接天线到应答器芯片和相应的嵌件基底的方法