[发明专利]一种基于卷积神经网络和多核学习SVM的关键音频检测方法有效

申请号：	201910319987.6	申请日：	2019-04-19
公开（公告）号：	CN110047506B	公开（公告）日：	2021-08-20
发明（设计）人：	朱宸都;应娜;李怡菲;蔡哲栋;刘兆森;杨鹏	申请（专利权）人：	杭州电子科技大学
主分类号：	G10L25/30	分类号：	G10L25/30;G10L25/03;G10L25/48;G06K9/62;G06N3/04
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	周希良
地址：	310018 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出一种基于卷积神经网络和多核学习SVM的关键音频检测方法，包括步骤：S1：处理音频数据集，得到音频原始波形序列数据集和音频声谱图数据集；S2：建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络；S3：使用音频的原始波形序列数据集和声谱图数据集分别训练一维和二维卷积神经网络，得到对应的两个特征提取的网络模型；S4：输入音频的原始波形序列和声谱图分别至对应的两个网络模型，提取对应的特征；S5：输入两类特征至多核支持向量机，构建基于特征融合模型的核函数，进行音频分类。本发明所述检测方法将卷积神经网络从音频语谱图和音频原始波形中提取的特征进行融合，提高了检测识别准确率。
搜索关键词：	一种基于卷积神经网络多核学习 svm 关键音频检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于卷积神经网络和多核学习SVM的关键音频检测方法，其特征在于，包括步骤：S1：处理音频数据集，得到音频原始波形序列数据集和音频声谱图数据集；S2：分别建立提取音频原始波形序列特征的一维卷积神经网络和提取音频声谱图特征的二维卷积神经网络；S3：使用音频原始波形序列数据集和音频声谱图数据集分别训练一维卷积神经网络和二维卷积神经网络，得到对应的两个特征提取的网络模型；S4：输入音频的原始波形序列和声谱图分别至对应的两个网络模型，提取得到对应的特征；S5：输入两类特征至多核支持向量机，构建基于特征融合模型的核函数，进行音频分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910319987.6/，转载请声明来源钻瓜专利网。

上一篇：基于神经网络的全语通的实现方法及相关产品
下一篇：一种声源识别方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于卷积神经网络和多核学习SVM的关键音频检测方法有效

专利文献下载