[发明专利]音频信号分类和编码有效
申请号: | 202010186693.3 | 申请日: | 2015-05-12 |
公开(公告)号: | CN111192595B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 艾力克·诺维尔;斯蒂芬·布鲁恩 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G10L19/04 | 分类号: | G10L19/04;G10L19/20;G10L25/18 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 陈慧 |
地址: | 瑞典斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 分类 编码 | ||
1.一种用于音频信号分类的方法,所述方法包括:
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合;
对所述稳定性值D(m)进行低通滤波,从而获得滤波后的稳定性值
通过使用S型函数将滤波后的稳定性值映射至标量范围[0,1],从而获得稳定性参数S(m);以及
基于所述稳定性参数S(m)对所述音频信号进行分类。
2.根据权利要求1所述的方法,其中,对所述音频信号的分类包括:确定在帧m中表示的音频信号的分段是包括语音还是音乐。
3.根据权利要求1所述的方法,其中,对所述音频信号的分类还基于定义与所述音频信号中的语音和音乐之间的转变相关的状态转移概率的马尔可夫模型。
4.根据权利要求1所述的方法,其中,对所述音频信号的分类还基于指示帧m的频谱内容的瞬态结构的瞬态测量。
5.根据权利要求1所述的方法,其中,将所述稳定性值D(m)确定为
其中,bi表示帧m中的频谱带,并且E(m,b)表示帧m中的频带b的能量测量。
6.一种音频信号分类器,所述分类器被配置为:
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合;
对所述稳定性值D(m)进行低通滤波,从而获得滤波后的稳定性值
通过使用S型函数将滤波后的稳定性值映射至标量范围[0,1],从而获得稳定性参数S(m);以及
基于所述稳定性参数S(m)对所述音频信号进行分类。
7.根据权利要求6所述的分类器,其中,被配置为对所述音频信号进行分类的所述分类器包括:被配置为确定在帧m中表示的音频信号的分段是包括语音还是音乐的分类器。
8.根据权利要求6所述的分类器,其中,被配置为对所述音频信号进行分类的所述分类器还被配置为:基于定义与所述音频信号中的语音和音乐之间的转变相关的状态转移概率的马尔可夫模型,对所述音频信号进行分类。
9.根据权利要求6所述的分类器,被配置为对所述音频信号进行分类的所述分类器还被配置为:基于指示帧m的频谱内容的瞬态结构的瞬态测量对所述音频信号进行分类。
10.根据权利要求6所述的分类器,其中,将所述稳定性值D(m)确定为
其中,bi表示帧m中的频谱带,并且E(m,b)表示帧m中的频带b的能量测量。
11.一种主机设备,所述主机设备包括根据权利要求6-10中任一项所述的音频信号分类器。
12.根据权利要求11所述的主机设备,所述主机设备被配置为基于由所述信号分类器执行的分类结果来从用于错误隐藏的多种方法中选择出一种用于错误隐藏的方法。
13.一种音频编码器,所述音频编码器包括根据权利要求6-10中任一项所述的音频信号分类器。
14.一种音频解码器,所述音频解码器包括根据权利要求6-10中任一项所述的音频信号分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010186693.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维场景呈现方法、装置及系统
- 下一篇:一种风力发电机叶片维护装置