[发明专利]低功率语音检测有效
申请号: | 201180075351.3 | 申请日: | 2011-12-06 |
公开(公告)号: | CN103959376B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | A.雷乔杜里;W.M.贝尔特曼;J.W.尚茨;C.托库纳加;M.E.戴舍尔;T.E.沃尔什 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F1/32 | 分类号: | G06F1/32;G10L25/84 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 叶晓勇;汤春龙 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 功率 语音 检测 | ||
允许具有最小功耗的语音处理的方法包含以第一时钟频率和第一电压记录时域音频信号,并且以第二时钟频率对时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号。可通过一个或多个滤波和增强技术来增强频域音频信号而获取更佳信噪比。增强的音频信号可用于生成总信号能量并且估计背景噪声能量。决策逻辑可从信号能量和背景噪声来确定人语音的存在或不存在。第一时钟频率可不同于第二时钟频率。
背景
技术领域
实施例通常涉及音频处理。更特别地,实施例涉及语音识别。
讨论
语音命令和连续的言语识别对于移动计算系统而言因为有限的键盘功能性而可能是重要的。然而,持续地监听环境中的潜在语音的功率成本可能太高以使得在系统可以开始监听之前大多数系统要求来自用户的输入。此方式会不便并且会限制许多潜在应用的实用性。
附图说明
通过阅读下文的说明书和所附权利要求,并且通过参考以下的图,本发明的实施例的各种优势将对于本领域的技术人员而变得明显,图中:
图1是图示言语识别系统的实施例的示例的框图;
图2是图示根据实施例的与音频信号有关的示例能量和帧的图表;
图3是表示噪声抑制的示例实施例的框图。
图4是图示与人语音检测操作关联的示例错误接受率和错误拒绝率的图表;
图5是语音活动检测模块的硬件架构实施例的示例;
图6是图示根据实施例的示例512点快速傅里叶变换的框图;
图7是图示根据实施例的快速傅里叶变换模块的示例硬件实现的框图;
图8是图示根据实施例的乘法和滤波模块的示例硬件实现的图;以及
图9是处理音频信号来检测人语音的示例方法的流程图。
具体实施方式
实施例可包括设备,它包含用于在存储器中存储时域中的音频信号的逻辑,其配置为基于第一时钟频率和第一电压来操作,并且基于第二时钟频率和第二电压对时域中的音频信号执行快速傅里叶变换(FFT)操作来生成频域中的音频信号。
实施例可包括计算机实现的方法,其包含以第一时钟频率和第一电压记录时域音频信号。该方法还包含以第二时钟频率对时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号。第一时钟频率可比第二时钟频率快。
实施例可包含计算机可读存储介质,具有一组指令,当处理器执行该组指令时,使计算机:以第一时钟频率和第一电压记录时域音频信号,以及以第二时钟频率对时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号。第一时钟频率可比第二时钟频率快。
转到图1,示出了图示言语识别系统100的实施例的框图。该系统可包含预处理模块101(配置为捕获音频信号)、前端处理模块102(配置为处理音频信号并且检测可包含在音频信号中的任何人语音信息)、以及后端处理模块103(配置为分析人语音信息并且执行与人语音信息关联的操作)。可注意到,音频信号可包含背景噪声和人语音信息。
预处理模块101可包含记录器105(例如,麦克风),它可用于将音频信号捕获为脉冲密度调制(PDM)信息流。PDM流可包含时域中的采用数字格式的音频信号。预处理模块101可包含PDM到脉冲编码调制(PCM)转换器110,它配置为接收PDM信息流并且生成PCM信息流。PCM信息流可被视为PDM信息流的数字表示。PCM信息流包含未编码的或原始信息。对于一些实施例,PCM数据流可以被直接接收。例如,记录器105可包含整合特征以使它生成PCM信息流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180075351.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:三维医学数据仿真模拟的远程共享与交互研讨方法
- 下一篇:用于变压器的爬梯