[发明专利]一种基于深度学习的声音事件检测和定位方法在审

申请号：	202111259094.0	申请日：	2021-10-28
公开（公告）号：	CN113921034A	公开（公告）日：	2022-01-11
发明（设计）人：	兰朝风;张媛媛	申请（专利权）人：	哈尔滨理工大学
主分类号：	G10L25/24	分类号：	G10L25/24;G10L25/30;G10L25/51
代理公司：	暂无信息	代理人：	暂无信息
地址：	150080 黑龙江省哈尔***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	在重叠声音事件检测任务中，有时会导致提取的全局特征无法准确地检测和定位重叠部分的声音事件。鉴于此，基于多尺度空间通道挤压激励卷积网络和门控循环单元（Gated Recurrent Unit,GRU）利用GRU来获取与上下文相关的声音事件的短期和长期序列特征，本发明提出了一种基于多尺度空间通道挤压激励（Multi‑scale spatial channel squeeze excitation，MscSE）的声音事件检测和定位模型。该模型与基线模型、残差网络模型在公开数据集DCASE2020Task3中进行对比实验。最佳结果分别为检测ER为0.59、F1分数为50.7%，定位误差DE和DE_F1分数分别为15.8，70.3%，F1分数比其它模型高2%~5%，ER也低于其它模型。由此可见，相比单一尺度的模型，基于多尺度的挤压激励模型在声音事件检测和定位性能均有所提升。
搜索关键词：	一种基于深度学习声音事件检测定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学，未经哈尔滨理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202111259094.0/，转载请声明来源钻瓜专利网。

上一篇：模拟心脏循环过程的生理教学用教具模型
下一篇：一种聚合物转化SiC/Cf

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的声音事件检测和定位方法在审

专利文献下载