[发明专利]一种基于多尺度时空注意力机制的语音情感识别方法在审
| 申请号: | 202310528013.5 | 申请日: | 2023-05-10 |
| 公开(公告)号: | CN116631449A | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 王志锋;陈增照;林梦婷;汪兵;冯子祚;龚斌;黄雯凯;赵传旭 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/03;G10L25/27 |
| 代理公司: | 武汉华之喻知识产权代理有限公司 42267 | 代理人: | 曹葆青;廖盈春 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于多尺度时空注意力机制的语音情感识别方法,属于语音分析技术领域。本发明方法包括:首先将经过预处理后的语音片段分别提取帧级特征和话语级特征;再从帧级特征中提取帧级深度空间特征和帧级深度时间特征;结合所述帧级深度空间特征和帧级深度时间特征得到帧级深度情感特征;同时从话语级特征中提取话语级深度情感特征;之后基于多头注意力机制融合帧级深度情感特征和话语级深度情感特征;最后利用损失函数优化模型,并通过所述模型输出语音片段的情感分类,最终利用多路决策方法决策出整体语音的情感分类。本发明语音情感识别方法基于语音中的多尺度时空深层情感特征,能有效提高现有语音情感识别技术的识别率。 | ||
| 搜索关键词: | 一种 基于 尺度 时空 注意力 机制 语音 情感 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310528013.5/,转载请声明来源钻瓜专利网。





