[发明专利]一种基于经验模态分解的音频识别方法及系统有效
申请号: | 201610103443.2 | 申请日: | 2016-02-25 |
公开(公告)号: | CN105788603B | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 岳廷明 | 申请(专利权)人: | 深圳创维数字技术有限公司;深圳市创维软件有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/18;G10L25/54;G10L15/02 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于经验模态分解的音频识别方法及系统。其中,方法包括步骤:A、输入原始音频信号,对所述原始音频信号进行采样,然后依次进行去噪预处理、加汉明窗以及傅氏变换处理得到频谱数据,再依次连接每帧的频谱数据,获得声谱图;B、获得所述声谱图各频率段的能量最大值所在点,并依次连接各频率段的能量最大值所在点生成时间‑频率曲线;C、将所述生成的时间‑频率曲线进行经验模态分解,获得多个本征模函数;D、通过获得的多个本征模函数结合相应的频率段以及时间帧,生成用于表征原始音频信号的多个特征值,并输出。本发明将音频特征的变化趋势信息充分融合到特征值的生成,使生成的特征值更完整的表征音频信号。 | ||
搜索关键词: | 一种 基于 经验 分解 音频 识别 方法 系统 | ||
【主权项】:
1.一种基于经验模态分解的音频识别方法,其特征在于,包括步骤:A、输入原始音频信号,对所述原始音频信号进行采样,然后依次进行去噪预处理、加汉明窗以及傅氏变换处理得到频谱数据,再依次连接每帧的频谱数据,获得声谱图;B、获得所述声谱图各频率段的能量最大值所在点,并依次连接各频率段的能量最大值所在点生成时间‑频率曲线;C、将所述生成的时间‑频率曲线进行经验模态分解,获得多个本征模函数;D、通过获得的多个本征模函数结合相应的频率段以及时间帧,生成用于表征原始音频信号的多个特征值,并输出;所述步骤D具体包括:D1、对每一个本征模函数等间隔取样,获得一组相应的取样序列;D2、在所述取样序列后追加所处的频率段序号;D3、对追加后的取样序列进行处理获得一个哈希值;D4、通过N组本征模函数获得N个哈希值,共同组成一组特征值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳创维数字技术有限公司;深圳市创维软件有限公司,未经深圳创维数字技术有限公司;深圳市创维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610103443.2/,转载请声明来源钻瓜专利网。