[发明专利]信号处理方法和装置有效

申请号：	200580047603.6	申请日：	2005-02-02
公开（公告）号：	CN101111888A	公开（公告）日：	2008-01-23
发明（设计）人：	松原光良;大谷猛;远藤香绪里;大田恭士	申请（专利权）人：	富士通株式会社
主分类号：	G10L21/02	分类号：	G10L21/02
代理公司：	北京三友知识产权代理有限公司	代理人：	李辉;吕俊刚
地址：	日本神***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	信号处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及信号处理方法和装置，具体地说，涉及例如用于数字移动电话的噪声消除器、VAD(语音活动检测)等中的语音信号处理所需的方法和装置。

背景技术

作为一种在数字移动电话等中抑制通信语音中的背景噪声以使得能够容易地听到语音的技术，噪声消除器可以被提及。同样，作为一种通过根据语音的存在/不存在而打开/关闭发射输出来节省发射部的电力的技术，VAD可以被提及。对于噪声消除器、VAD等，需要在通信过程中确定语音存在的分段或者没有语音存在的分段。

作为确定这分段的方法，例如可以提及下述的方法，即，通过将过去计算出的长期的平均功率看作噪声的功率，将噪声功率与当前分段中的功率进行比较，以将功率较大的当前分段确定或判定为语音分段。然而，仅通过这种简单的功率比较，当背景噪声电平很高并且信噪比SNR_n很小时，存在语音被错认为噪声的情况。

作为对于这种情况的措施，已经提出了通过利用语音的频域信号来执行分段确定的方法(例如参见专利文献1)。在下文中，将对这种技术进行描述。

对输入信号周期性地执行时间-频率转换。计算输入信号的频域信号(在下文中，称为输入频谱)。把过去计算出的长期的平均输入频谱看作噪声频谱(在下文中，称为平均噪声频谱)。为平均噪声频谱和输入频谱中的每一个计算每带宽的信噪比SNR_n，以便在所需带宽下计算每带宽的信噪比SNR_n的平均值、正(负)变化量、离差值(dispersion value)等。通过利用这些值，来执行分段确定。同样，仅在通过上述分段确定将该分段确定为噪声分段时，才利用输入频谱对平均噪声频谱进行更新。因此，实现了更精确的分段确定。

专利文献1：日本专利申请特开No.2001-265367

发明内容

然而，如在专利文献1中所述的现有技术中，仅在噪声分段中对平均噪声频谱进行更新。因此，当噪声电平急剧上升时，噪声分段被错认为语音分段，此后不对平均噪声频谱进行更新，从而不利地持续错误的确定。

为了避免这种错误的确定，专利文献1还公开了下述的方法，即，根据每带宽的信噪比SNR_n来控制噪声更新的时间常数，以与分段确定的结果无关地对噪声进行更新。

然而，当在语音分段中对平均噪声频谱进行更新时，由于语音的影响而对平均噪声频谱明显估计过高。因此，出现了一个新的问题，即，低电平的语音分段很容易被错认为噪声分段。

因此，本发明的一个目的是提供一种信号处理方法和装置，其中，在具有急剧上升的噪声电平的分段中，提高所估算的噪声的跟踪速度(following speed)，以使得在信号分段中几乎不产生由于语音的影响而导致的噪声频谱的估算误差。

(1)为了实现上述目的，根据本发明的信号处理方法包括：时域信号提取步骤，用于提取时域信号，所述时域信号是输入信号的抽样数据；频域信号分析步骤，用于按帧将所述时域信号转换成频域信号，并计算输入频谱；以及噪声估算步骤，通过利用所述输入频谱的最小分量来估算噪声频谱，所述噪声频谱是包括在所述输入信号中的噪声分量的频域信号。将参照附图对这种方法进行描述。

首先，采用如图1所示的输入信号(叠加了噪声的语音)作为示例。在图1中，分段(i)与(iv)是“噪声独占分段”(在下文中，称为噪声分段)。在分段(iii)中，出现了噪声电平的急剧上升。分段(ii)与(v)是“混合了语音与噪声的混合分段”(在下文中称为混合分段)。图2示出了上述分段(i)、(ii)、(iv)以及(v)的典型输入频谱。

当将图2中的分段(i)的输入频谱A与分段(ii)的输入频谱A进行比较时，分段(ii)中的“语音和噪声的混合分段”中的输入频谱A的最小部分(图2中的实心圆)被所叠加的噪声屏蔽，其中噪声的贡献程度很高。因此，这些最小部分变得在值方面等于作为“噪声独占分段”的分段(i)中的输入频谱的最小部分。对于噪声电平增加的情况也是一样，以使得作为“噪声独占分段”的分段(iv)中的频谱的最小部分的值变得等于作为“语音和噪声的混合分段”的分段(v)中的频谱的最小部分的值。在下文中，用直线来连接输入频谱的最小部分，这将被称为如图2所示的最小频谱B。

基于这种原理，在本发明的时域信号提取步骤与频域信号分析步骤中，根据预定分段的时域的输入信号计算作为频域信号的输入频谱A。在噪声估算步骤中，通过利用输入频谱A的最小值来获得最小频谱B，以估算作为当前帧内的噪声分量的频域信号的噪声频谱。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于富士通株式会社，未经富士通株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200580047603.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]信号处理方法和装置有效

专利文献下载