[发明专利]基于数据驱动的有监督字典学习音频分类方法、系统及介质有效
| 申请号: | 202110988214.4 | 申请日: | 2021-08-26 |
| 公开(公告)号: | CN113807408B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 陈真;邱小群;向友君;张淘珊 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/214;G06F18/28;G06F18/21;G10L15/06 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 驱动 监督 字典 学习 音频 分类 方法 系统 介质 | ||
本发明公开了一种基于数据驱动的有监督字典学习音频分类方法、系统及介质。该方法包括:确定样本集类别数;利用输入的样本及其对应的类标签训练特定类字典;利用已训练的字典得出输入样本的稀疏编码,并将稀疏编码作为特征,训练SVM分类器;利用已训练的字典和已训练的SVM分类器对输入样本进行分类,输出预测标签。本发明通过每个类学习一个字典来实现最小化类内均匀性,最大化类的可分性,提高稀疏性以控制信号在字典上分解的复杂性,同时最小化基于类的重构错误,并提高字典的成对正交性。本发明能够广泛应用于多个场景中,如计算听觉场景识别和音乐和弦识别;其在数据集上的测试也相对稳定,泛化能力表现优秀。
技术领域
本发明属于稀疏表示,监督字典学习的技术领域,具体涉及一种基于数据驱动的有监督字典学习音频分类方法、系统及介质。
背景技术
传统的字典学习公式最大限度地减小了给定信号与其在学习字典上的稀疏表示之间的重构误差。虽然这个方法对于解决信号去噪很方便,但是由于它的最终目标是通过学习到的字典去获得训练信号的区分性分解,所以它可能不适用于分类任务。由于传统字典学习技术在分类方面的局限性,有监督字典学习得到了广泛的应用。
Ramirez等人建议通过加强字典的正交性来获取不同的信息,使学习字典尽可能的不同,即一个类对应一个字典;Fulkerson等人提出首先学习一个非常大的字典,然后根据包含凝聚信息瓶颈(AIB)的预定义准则合并字典的原子以起到压缩字典的效果;Mairal等人提出联合学习字典与分类任务;随后张和杨等人提出将类别标签嵌入字典以及稀疏编码的学习当中以达到最小化类内差异与最大化类间差异的作用。
发明内容
本发明的主要目的在于克服传统字典学习方法对音频识别任务的缺点与不足,提供一种基于数据驱动的有监督字典学习音频分类方法、系统及介质,针对每个不同的类,学习不同的对应的字典,以提取异构信息进行分类,通过促进类特定字典之间的成对正交性和控制音频片段在这些字典上分解的稀疏性结构,寻求最小化类内的同质性和最大化类间的可分离性。
为了达到上述目的,本发明采用以下技术方案:
本发明的一个方面,提供了一种基于数据驱动的有监督字典学习音频分类方法,包括下述步骤:
S1、确定样本集类别数C,利用输入的样本xn,及其对应的类标签yn训练C个特定类字典Dc,c∈[1,C];
S2、利用已训练的字典Dc,c∈[1,C],得出输入样本xn的稀疏编码an,并将稀疏编码作为特征,训练SVM分类器;
S3、利用已训练的字典Dc,c∈[1,C],和已训练的SVM分类器对输入样本xn进行分类,输出预测标签y~n。
作为优选的技术方案,所述训练C个特定类字典Dc,c∈[1,C]如下:
S11、初始化字典Dc0,学习率η0,学习率更新率α,迭代次数T;
S12、确定损失函数J;
S13、开始次数为T的迭代求解过程,当迭代次数为t时,固定字典Dt-1,计算稀疏编码集合At;
S14、固定稀疏编码的集合At,更新字典Dct;
S15、t=t+1,进入下一次迭代,直至t=T。
作为优选的技术方案,所述损失函数J具体形式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110988214.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





