[发明专利]使用话带信号的语音识别装置和方法无效

专利信息
申请号: 200680025607.9 申请日: 2006-12-01
公开(公告)号: CN101223574A 公开(公告)日: 2008-07-16
发明(设计)人: 曹灌铉;韩汶星;朴俊锡;郑泳圭 申请(专利权)人: 韩国电子通信研究院
主分类号: G10L15/20 分类号: G10L15/20;G10L15/02;G10L15/28
代理公司: 北京市柳沈律师事务所 代理人: 钱大勇;邵亚丽
地址: 韩国*** 国省代码: 韩国;KR
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 信号 语音 识别 装置 方法
【说明书】:

技术领域

本发明涉及使用一种话带信号(voice band signal)的语音识别装置和方法,而且更具体地,涉及这样的语音识别装置及其方法:其通过计算话带信号与包含噪声的语音信号之间的频谱差值、基于所述频谱差值计算相邻帧的每个频带中的平均数、向所述平均数分派通过实验得到的权重从而执行归一化(normalization)并产生归一化值、借助利用所述归一化值补偿所述话带信号来提取特征向量、以及学习(learn)所述特征向量的识别模型来识别语音。

背景技术

随着有线/无需通信的发展,语音识别技术已经备受关注。语音识别技术的优点在于,其能够为用户提供更方便的接口。

为了在现实生活中利用语音识别技术,必须减少叠加在语音中的干扰信号的影响。

干扰信号是可能叠加在作为实际识别目标的语音中的每一种信号。干扰信号的示例包括由环境噪声导致的失真、通信线路失真、回声、背景音乐、他人的语音等等。由环境噪声导致的失真是显著降低语音识别性能的因素。因而,已经积极地开展关于补偿由环境噪声导致的失真的研究。

作为一种用于补偿由环境噪声导致的失真的方法,韩国专利登记号No.0446626公开了一种噪声抑制方法。根据韩国专利登记号No.0446626,依次使用独立分量分析(Independent Component Analysis,ICA)和谱相减法来抑制语音信号中的噪声。

作为另一种方法,韩国专利公布号No.0442825公开了一种用于语音识别的环境补偿方法。根据韩国专利登记号No.0442825,利用环境补偿方法来补偿被噪声或线路失真污染的语音的频谱,以获得与实际语音频谱接近的频谱。

然而,因为使用ICA来控制噪声信号,所以韩国专利公布号No.0446626需要大量的计算,而且在噪声的类型与语音类似时难以分离信号。

韩国专利登记号No.0442825使用平均补偿方法,其没有通过估计代表噪声或线路失真的环境参数来对任意环境进行优化。因而,对具体环境的适应性较差。

此外,韩国专利登记号No.0442825在利用相对于被污染的语音信号的环境参数来补偿失真语音信号的过程中需要大量的计算。因而,难以在资源有限的实时小型设备(例如,小型移动终端)中操作。

发明内容

技术问题

因而,本发明的目的是提供一种这样的语音识别装置及其方法:其通过计算话带信号与包含噪声的语音信号之间的频谱差值、基于所述频谱差值计算相邻帧的每个频带中的平均数、向所述平均数分派通过实验得到的权重从而执行归一化并产生归一化值、借助利用所述归一化值补偿所述话带信号来提取特征向量、以及学习所述特征向量的识别模型来识别语音。

技术方案

根据本发明的一个方面,提供一种语音识别装置,包括:信号处理单元,用于计算话带信号的对数频谱和包含噪声的语音信号的对数频谱,所述话带信号和所述语音信号接收自外部信道;权重计算单元,用于通过利用所述话带信号的对数频谱和所述语音信号的对数频谱分派权重来计算归一化值,并利用所述归一化值补偿所述话带信号的对数频谱;特征提取单元,用于从所述话带信号的经补偿的对数频谱中提取特征向量;以及识别单元,用于利用所述特征向量学习识别模型并执行语音识别。

根据本发明的另一个方面,提供一种语音识别方法,包括步骤:a)计算话带信号的对数频谱和包含噪声的语音信号的对数频谱,所述话带信号和所述语音信号接收自外部信道;b)通过利用所述话带信号的对数频谱和所述语音信号的对数频谱分派权重来计算归一化值,并利用所述归一化值补偿所述话带信号的对数频谱;c)从所述话带信号的经补偿的对数频谱中提取特征向量;以及d)利用所述特征向量学习识别模型并执行语音识别。

有益效果

根据本发明的语音识别装置和方法通过利用话带信号,即便在严重的噪声环境中也能够正确地识别用户的命令。

此外,由于抑制环境噪声仅需要少量的计算,因此本发明可以应用于适合于例如个人数字助理(PDA)的使用有限资源的小型移动设备的识别装置。

更进一步,本发明可以提供便于不能自由运用他们的双手的伤残人士的可替代接口。

附图说明

通过下面参照附图对优选实施例的描述,本发明的以上和其它目的和特征将变得显而易见,其中:

图1是根据本发明的实施例的使用话带信号的语音识别装置的框图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院,未经韩国电子通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680025607.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top