[发明专利]一种基于子空间表示学习的声学事件识别方法有效

申请号：	201910447562.3	申请日：	2019-05-27
公开（公告）号：	CN110148428B	公开（公告）日：	2021-04-02
发明（设计）人：	韩纪庆;史秋莹;罗辉;郑铁然;郑贵滨	申请（专利权）人：	哈尔滨工业大学
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/45;G10L25/24;G06K9/62
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	时起磊
地址：	150001 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于子空间表示学习的声学事件识别方法，涉及声音信号处理技术领域，为解决现有技术在AER任务中，语义特征提取时不能兼顾原始信号本质内容和时序结构的问题，包括：步骤1、信号预处理，步骤2、帧级特征提取，步骤3、子声学事件特征提取，步骤4、子声学事件特征的时序扩展，步骤5、子声学事件特征间的整体语义特征提取，步骤6、声学事件的识别，本发明提取语义特征时，能够兼顾原始信号的整体内容信息和全局时序结构。
搜索关键词：	一种基于空间表示学习声学事件识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于子空间表示学习的声学事件识别方法，其特征在于包括以下步骤：步骤1、信号预处理：首先对原始声学事件信号进行训练集和测试集的分割，然后将分割后的声学事件信号转换为单信道信号，最后对上述单信道信号进行采样；步骤2、帧级特征提取：将采样后的单信道信号切分为多个音频帧，并对多个音频帧分别提取梅尔倒谱系数特征，得到帧级特征；步骤3、子声学事件特征提取：先对步骤2中得到的帧级特征进行聚类，得到多个聚类中心，再根据相邻的多个帧级特征与聚类中心的距离统计声学事件信号的局部语义特性，即得到子声学事件特征；步骤4、子声学事件特征的时序扩展：对子声学事件特征利用时域变换平均的方法进行平滑，并利用卡方核对平滑后的子声学事件特征进行非线性扩展；步骤5、子声学事件特征间的整体语义特征提取：将步骤4中得到的子声学事件特征用向量x_i表示，且x_i∈R^D，将N个特征向量x_i拼接成矩阵X用于描述由N个子声学事件构成的声学事件信号，其中X∈R^D×N，i＝1,...,N，子声学事件间蕴含的整体语义特征可由如下目标函数实现：其中，u∈R^D×d，u是一个d维子空间S的基，uu^TX为X在子空间S上的投影；步骤6、声学事件的识别：对于训练集和测试集中的每一个声学事件信号，先对其分别进行上述步骤1至步骤5中所述的预处理及特征提取过程，再利用训练集中所有样本的语义特征作为SVM的输入进行训练，然后利用测试集完成模型的测试，最后利用训练好的SVM分类器，完成声学事件识别任务。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学，未经哈尔滨工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910447562.3/，转载请声明来源钻瓜专利网。

上一篇：音频处理方法、装置、系统、存储介质、终端及服务器
下一篇：音频的录制方法和装置、存储介质及电子装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于子空间表示学习的声学事件识别方法有效

专利文献下载