[发明专利]低信噪比环境下基于多频带能量分布的动物声音检测方法有效
申请号: | 201611040015.6 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106653032B | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 李应;王巧静 | 申请(专利权)人: | 福州大学 |
主分类号: | G10L17/20 | 分类号: | G10L17/20;G10L17/26;G10L25/18;G10L17/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 低信噪 环境 基于 频带 能量 分布 动物 声音 检测 方法 | ||
1.一种低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于,包括以下步骤:
步骤S1:利用多滤波器组对待测声音样本进行时频分析,获得多频带频谱图;
步骤S2:分析所述多频带频谱图的频率及能量分布,获取多频带能量分布图;
步骤S3:对所述多频带能量分布图进行分块DCT,并提取DCT系数矩阵中的低频系数作为所述待测声音样本的特征;
步骤S4:根据步骤S1至步骤S3对若干训练声音样本进行处理,获取训练声音样本的特征,并采用随机森林分类器对所述训练声音样本的特征进行训练,得到随机森林;
步骤S5:将所述待测声音样本的特征代入随机森林进行测试,确定所述待测声音样本的类标。
2.根据权利要求1所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述步骤S1的具体内容如下:待测声音样本y(t)通过gammatone滤波器组滤波得到yf[t],对yf[t]取对数进行动态压缩,形成相应的gammatone频谱图Sg(f,t):
Sg(f,t)=log|yf[t]|
其中,f表示gammatone滤波器组的滤波器的中心频率,t是所述待测声音样本的帧索引。
3.根据权利要求2所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述gammatone滤波器组的数目为256。
4.根据权利要求2所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述步骤S2的具体内容如下:
步骤S21:对所述gammatone频谱图Sg(f,t)进行归一化处理,得到归一化能量谱G(f,t):
步骤S22:按下式对归一化能量谱G(f,t)的负值进行调整:
步骤S23:对归一化能量谱G(f,t)的能量分布进行统计,得到多频带能量分布图:
其中,W为待测声音样本的长度,M(f,b)表示在频带f中能量等级为b的元素占该频带元素总数的比例,Ib(G(f,t))为指示函数,当G(f,t)属于能量等级b时,其值为1,否则为0;B为能量等级数目。
5.根据权利要求4所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述步骤S23中,设置能量等级数目为:B=64。
6.根据权利要求4所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述步骤S3的具体内容如下:
步骤S31:对多频带能量分布图进行8×8分块,并对子块进行DCT得到DCT系数矩阵;
步骤S32:对所述DCT系数矩阵进行Zigzag扫描编码得到DCT系数的一维Zigzag排列;
步骤S33:选取所述一维Zigzag排列的前k个系数作为所述待测声音样本的特征。
7.根据权利要求6所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述k=5。
8.根据权利要求6所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述步骤S5的具体内容如下:
步骤S51:将所述待测声音样本的特征置于随机森林中所有n棵决策树的根节点处;
步骤S52:按照决策树的分类规则,由根节点依次向下传递直到到达某一叶节点,该叶节点对应类标签便是这棵决策树对待测声音样本的特征所属类别所做的投票;
步骤S53:随机森林的n决策树均对待测声音样本的特征的类别进行了投票,统计随机森林中n棵决策树投票,其中票数最多的类标签便是待测声音样本最终对应的类标。
9.根据权利要求1所述的低信噪比环境下基于多频带能量分布的动物声音检测方法,其特征在于:所述训练声音样本为取自Freesound声音数据库的50种声音事件,每种声音事件包括30个样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611040015.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:酒瓶(圆形)
- 下一篇:一种语音解锁装置、终端及方法