[发明专利]基于短时傅里叶变换的单一频率报警声音特征检测方法有效

申请号：	201410003377.2	申请日：	2014-01-03
公开（公告）号：	CN103674235A	公开（公告）日：	2014-03-26
发明（设计）人：	魏树银;高会军;于金泳;孙光辉;吴立刚	申请（专利权）人：	哈尔滨工业大学
主分类号：	G01H17/00	分类号：	G01H17/00
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	张宏威
地址：	150001 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于傅里叶变换单一频率报警声音特征检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及单一频率报警声音特征检测技术。

背景技术

在工业生产和日常生活中，许多方面都需要用到报警声音。

报警声音通常是单一频率的。一些紧急情况下的报警声音，其频率较高并且幅值保持不变，这种声音听起来比较刺耳，起到警告的作用；普通情况下的报警声音要求是和弦的，即幅值从最大单调减小到最小并保持一段时间，这种声音听起来比较柔和，起到提示的作用，和弦信号可以是周期的，也可以是非周期的。

对于此类单一频率的声音信号，我们首先需要检测它的频率和强度是否符合设计要求。如果信号是和弦信号，还需要检测信号幅值的变化特征是否符合设计要求，需要检测音频信号的端点以及周期的大小。

对于幅值不变的信号，可以先对数据进行一些处理，例如归一化，数字滤波等。然后使用短时傅里叶变换即可得到信号的频率和幅值，处理过程比较简单。

对于和弦信号，由于频率是单一的，用短时傅里叶变化可以得到信号的频率。使用短时能量方法可以得到音频信号幅值的变化规律。使用过零率加短时能量的方法可以得到音频信号的端点和周期。

过零率是一段时间内信号符号发生变化的次数，例如信号从正数变为负数，也可以反过来，在某些情况下，只统计正向或者负向变化的次数，因为两次正向之间必有一次负向，反之亦然。当声音的频率发生变化或者有声变无声，无声变有声时，过零率就会出现差别，可以用于音频端点的检测，能够发挥出很好的作用。

短时能量就是一段时间内信号各个采样点幅值的平方和。短时能量的理论依据是音频信号能量的大小，有声音时音频信号能量大，短时能量大；无声音时音频信号的能量小，短时能量也小。由于待处理的音频信号幅值是从最大开始减小到最小的，因此可以只取两个门限值，超过第一个门限值代表声音开始，低于第二个门限值代声音停止。

但是在实际使用过程中发现，车间的噪声非常大，对于过零率和短时能量都有很大的影响，因此必须先进行高阶的数字滤波。高阶数字滤波需要较多的时间，会影响到检测的实时性。因此需要使用更加快速有效的方法，在此，选择了短时傅里叶变化来处理音频数据。

短时傅里叶变换（STFT，short-time Fourier transform，或short-term Fourier transform)）是和傅里叶变换相关的一种数学变换，用以确定时变信号其局部区域正弦波的频率与相位。

它的思想是：选择一个时频局部化的窗函数，假定分析窗函数g(t)在一个短时间间隔内是平稳（伪平稳）的，移动窗函数，使f(t)g(t)在不同的有限时间宽度内是平稳信号，从而计算出各个不同时刻的功率谱。短时傅里叶变换使用一个固定的窗函数，窗函数一旦确定了以后，其形状就不再发生改变，短时傅里叶变换的分辨率也就确定了。如果要改变分辨率，则需要重新选择窗函数。短时傅里叶变换用来分析分段平稳信号或者近似平稳信号犹可，但是对于非平稳信号，当信号变化剧烈时，要求窗函数有较高的时间分辨率；而波形变化比较平缓的时刻，主要是低频信号，则要求窗函数有较高的频率分辨率。短时傅里叶变换不能兼顾频率与时间分辨率的需求。短时傅里叶变换窗函数受到W.Heisenberg不确定准则的限制，时频窗的面积不小于2。这也就从另一个侧面说明了短时傅里叶变换窗函数的时间与频率分辨率不能同时达到最优。

发明内容

本发明的目的是为了解决提取大噪声下环境下单一频率报警声音的特征时，采用过零率和短时能量方法需要高阶数字滤波，导致检测时间长的问题，提供一种基于短时傅里叶变换的单一频率报警声音特征检测方法。

本发明所述的基于短时傅里叶变换的单一频率报警声音特征检测方法，所述单一频率报警声音特征包括频率、幅值、周期、有声时间长度和静音时间长度，所述方法通过以下步骤实现：

步骤一、将原始音频信号数据进行分段，每段音频信号的数据个数均相等，1个数据是指一次采样得到的数据；

步骤二、对每段音频信号数据进行短时傅里叶变换，以求得每段音频信号的幅值和频率，记录下音频信号的幅值；

步骤三、将每次记录下来的音频信号的幅值连接起来，以得到音频信号的幅值随时间变化的图像；

步骤四、确定音频信号端点：选择一个开始幅值阀值和一个截止幅值阀值，将步骤三得到的图像与开始幅值阀值和截止幅值阀值进行比较，当幅值大于开始幅值阀值时，该幅值对应的时间点为开始端点，当幅值小于截止幅值阀值时，该幅值对应的时间点为截止端点，所述的开始端点和截止端点即为音频信号的端点；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学，未经哈尔滨工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410003377.2/2.html，转载请声明来源钻瓜专利网。

上一篇：累积腐蚀产物采样装置
下一篇：用于从涡轮机移除内壳体的方法和引导件

同类专利

专利分类

G 物理

G01 测量；测试
G01H 机械振动或超声波、声波或次声波的测量
G01H17-00 不包含在本小类其他组中的机械振动或超声波、声波或次声波的测量

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于短时傅里叶变换的单一频率报警声音特征检测方法有效

专利文献下载