[发明专利]低信噪比环境下基于多频带能量分布的动物声音检测方法有效
申请号: | 201611040015.6 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106653032B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 李应;王巧静 | 申请(专利权)人: | 福州大学 |
主分类号: | G10L17/20 | 分类号: | G10L17/20;G10L17/26;G10L25/18;G10L17/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 低信噪 环境 基于 频带 能量 分布 动物 声音 检测 方法 | ||
本发明涉及一种低信噪比环境下基于多频带能量分布的动物声音检测方法,包括以下步骤:步骤S1:利用多滤波器组对待测声音样本进行时频分析,获得多频带频谱图;步骤S2:分析所述多频带频谱图的频率及能量分布,获取多频带能量分布图;步骤S3:对所述多频带能量分布图进行分块DCT,并提取DCT系数矩阵中的低频系数作为所述待测声音样本的特征;步骤S4:根据以上步骤对若干训练声音样本进行处理,获取训练声音样本的特征,并采用随机森林分类器对所述训练声音样本的特征进行训练,得到随机森林;步骤S5:将所述待测声音样本的特征代入随机森林进行测试,确定所述待测声音样本的类标。本发明相比于现有技术在低信噪比的情况下具有良好的鲁棒性。
技术领域
本发明涉及一种低信噪比环境下基于多频带能量分布的动物声音检测方法。
背景技术
低信噪比声音事件检测,就是试图检测、分类和识别嵌入在各种噪声和混响音频信号中的相对微弱的声音对象。近来,声音事件检测引起广泛关注。随着网络中多媒体数据的快速增长,基于音频数据的多媒体搜索具有极大的应用价值,同时,声音事件检测也是分析环境的关键组成之一。如,它对于音频取证、环境声音识别、生物声音监控、声场景分析,实时军事关注点的检测、定位跟踪和声源分类,病人监护、非正常事件监测及故障诊断、递交早期维护的关键信息等都具有重要意义。
关于声音事件检测,目前的研究包括吵闹环境下特定的声音事件检测方法;声音事件检测分类的有效特征及方法;背景/前景检测、声音事件分类和声音事件定位方法;声音场景、室内声音事件以及室内综合声音事件的检测与分类方法;特定环境下特定声音的检测方法等。
其中,Sharan和Moir用灰度共生矩阵(gray-level co-occurrence matrix,GLCM)图像纹理分析技术,提取耳蜗谱图(cochleogram image,CI)的纹理、得到耳蜗谱图纹理特征(cochleogram image texture feature,CITF),并把CITF与线性gammatone倒谱系数(gammatone cepstral coefficients,GTCCs)相结合,用CITF-GTCCs,对0dB的声音事件的分类检测精度可以达到78%。McLoughlin等提出经过降噪(de-noising,DN)处理的时频谱特征(spectrogram image feature,SIF),通过深度神经网络(deep neural network,DNN)结合多条件(multi-conditions,MC)训练与e-尺度的声音事件分类,即SIF-DNN-DN-MC-e,对0dB的声音事件的分类检测精度可以达到87%。Dennis等抽取声谱图的局部最大成份作为峰值码,用改进的脉冲神经网络(spiking neural network,SNN)学习峰值码的时间分布,对0dB的声音事件的分类精度可以达到82%。Espi等提出多个单分辨分解的DNN并行工作和局部谱图的卷积神经网络(convolution neural network,CNN)的模型进行声音事件的有效检测。Phan等用超帧训练三个随机森林分类器,分别识别背景/前景、声音事件类型和声音事件的起始与偏移点。Stowell等报告了自动分类声音场景及检测声音事件的最新进展,并提供城市、办公和居住环境相关、可用于声音场景分类和声音事件检测的声音参考数据。Wang等用匹配追踪(matching pursuit,MP),在Gabor原子字典选取原子近似表示声音信号,再用主成分分析(principal component analysis,PCA)和线性判别分析(lineardiscriminant analysis,LDA)对不一致的频率-尺度进行映射形成特征,通过支持向量机(support vector machine,SVM)进行分类检测。Sharma和Kaul用二级分类器,在室内、户外、谈话、大型集会、机械和多媒体设备声音等六种声场景中,进行尖叫和哭泣声的危难检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611040015.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:酒瓶(圆形)
- 下一篇:一种语音解锁装置、终端及方法