[发明专利]信号分类方法和装置在审
申请号: | 201110267965.3 | 申请日: | 2011-09-09 |
公开(公告)号: | CN103000172A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 卢敏;窦维蓓;覃春花;袁浩;唐庆余;黎家力 | 申请(专利权)人: | 中兴通讯股份有限公司;清华大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李健;龙洪 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 分类 方法 装置 | ||
技术领域
本发明涉及多媒体信号处理和模式识别领域,特别涉及一种信号分类方法和装置。
背景技术
语音信号和音乐信号各自的发声原理不同。语音信号主要是指人说话时发出的声音。音乐信号一般包含了更为广泛的类别,比如管弦乐、打击乐、声乐以及多种音源的混合。这两类信号不仅在听觉上存在差别,在不同的场合,对两类信号的处理方式也不一样。
在编解码应用中,语音信号通常采用基于线性预测的方式编码,而音乐信号则广泛地采用变换域编码方式。对于类别不确定的信号输入时,希望能够判别出信号类别后再分别采用不同的方式编码,这样可以有效地降低编码码率同时保持较高编码质量。因此对输入信号的准确分类就显得十分关键,它影响着输出音频信号码率的质量。
在噪声抑制应用中,通常希望对移动条件下的语音通话进行噪声抑制,而对于彩铃而言,通常彩铃音乐信号来自媒体服务器,没有被环境噪声污染,故而不需要进行噪声抑制。
因此,在复杂的现代通信系统中,针对类别多样的音频信号需要按照不同的方式进行处理。为了获得更好的主观体验,通常需要将音频信号区分为语音、音乐。这首先就需要一个高效、准确的信号分类算法。
目前常用的信号分类器设计方法较多,常见的有基于特征计算加概率模型的方法,以及特征计算加函数逼近方法。特征计算主要包括信号的时域、频域等参数。概率模型方法大致包括混合高斯模型、隐马尔可夫模型、支持向量机、决策树等。而神经网络则是使用非线性神经元的函数逼近方法。但实际应用于通信系统中,还有较多因素需要考虑,如分类器延时、复杂度、准确率、鲁棒性等指标。
在实时的通信中,现有的信号分类算法由于复杂度、延时和分类正确率而不能满足高效率、高质量的编码器的需求。
发明内容
本发明所要解决的技术问题是:提供一种信号分类方法和装置,以获得更稳定和更高的分类正确率,且能满足低复杂度、低延时算法的需求。
为了解决上述问题,本发明提供了一种信号分类方法,包括:
从待分类的信号中获取多个数据单元,一个数据单元提取m个特征参数组成一个短时特征向量,m为整数且大于等于1;
从所述多个数据单元中取一组数据单元,对该组数据单元中共K个数据单元对应的K个短时特征向量Xp,p=1...K进行S种统计处理,得到一个长时特征向量,所述长时特征向量由一组统计向量Ys组成,s=1...S,其中,向量Ys的第j个元素由向量X1至Xp的第j个元素进行第s种统计处理得到,所述S为整数且大于等于1,j=1...m,K大于等于1;重复执行上述步骤,直到得到n组数据单元对应的n个长时特征向量,n为整数且大于等于2;其中,各组数据单元之间包含的数据单元个数不同;
将该n个长时特征向量根据预设原则送入n个预先训练得到的分类器中,得到多个分类结果;
根据所述多个分类结果按照预设决策融合机制得到最终分类结果。
进一步的,上述方法还可具有以下特点,所述方法还包括:提取所述特征参数前,对所述待分类的信号进行高频滤波处理。
进一步的,上述方法还可具有以下特点,所述一个数据单元的m个特征参数包括如下特征参数中的一个或多个:
数据单元的对数能量,过零率、子帧对数能量、基音周期、频谱重心、频谱通量;
所述子帧对数能量为:
将所述数据单元划分为N个子帧,获取每个子帧的对数能量,得到N个对数能量,N大于1且为整数。
进一步的,上述方法还可具有以下特点,所述统计处理包括如下之一或其组合:
取最大值、最小值、方差、标准差和数学期望值。
进一步的,上述方法还可具有以下特点,所述将该n个长时特征向量根据预设原则送入n个预先训练得到的分类器中包括:
对该n个长时特征向量中任一个长时特征向量,将该长时特征向量只送入与该长时特征向量对应的一个分类器;或者,将该长时特征向量送入与该长时特征向量对应的一个分类器,及至少一个其它分类器。
进一步的,上述方法还可具有以下特点,根据所述多个分类结果按照预设决策融合机制得到最终分类结果包括:
将所述多个分类结果中,数量最多的相同的分类结果作为最终分类结果。
进一步的,上述方法还可具有以下特点,从所述待分类的信号中获取多个数据单元时,只提取能量值超过指定门限值的数据单元。
本发明还提供一种信号分类装置,包括:短时特征提取模块、长时特征提取模块、分类模块和决策融合模块,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;清华大学,未经中兴通讯股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110267965.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:穿衬底通孔尖端的聚合物后显现
- 下一篇:一种可移动垃圾分类收集箱