[发明专利]一种多模态情感识别方法及系统有效
| 申请号: | 202110333007.5 | 申请日: | 2021-03-29 |
| 公开(公告)号: | CN113076847B | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 姜晓庆;陈贞翔;杨倩;郑永强 | 申请(专利权)人: | 济南大学;山东思正信息科技有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/80;G06V10/82;G06N3/08;G06N20/10;G10L15/05 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫圣娟 |
| 地址: | 250022 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多模态 情感 识别 方法 系统 | ||
1.一种多模态情感识别方法,其特征在于,包括:
提取情感视频中的情感语音分量及情感图像分量,并分别存储;
利用情感语音残差条件熵差值端点检测方法对所述情感语音分量进行端点检测,获得每帧语音的端点检测结果;包括以下步骤:
步骤(1):对情感语音分量分帧得到短时语音帧,并获取短时语音帧的观测值;
步骤(2):根据所述观测值,计算上一次迭代估计值与观测值的残差及残差与传感矩阵的相关性;
步骤(3):寻找观测矩阵中相关性最大原子,更新信号重建的支撑集;
步骤(4):使用最小二乘法对短时语音帧逼近,得到其估计值;
步骤(5):更新残差,计算残差条件熵,迭代执行步骤(2)-步骤(5),直至达到稀疏度条件后停止迭代;
步骤(6)计算第一次迭代与最后一次迭代的残差条件熵差值;短时重建语音帧拼接重建整个语音数据样本;
步骤(7)利用预设阈值对重建的情感语音分量进行判断,高于所述阈值则认为该帧语音为有声段,低于所述阈值则认为该帧语音为无声段,获得该帧语音的端点检测结果;
基于情感语音分量的端点检测结果对情感图像分量中的情感图像进行筛选,剔除情感图像分量中无声段的情感图像;
分别对重建后的情感语音分量和筛选后的情感图像分量进行特征提取;
对情感语音分量的特征与情感图像分量的特征进行融合,并通过融合特征对情感识别模型进行训练;
利用训练好的情感识别模型实现多模态的情感识别。
2.如权利要求1所述的一种多模态情感识别方法,其特征在于,所述情感语音残差条件熵差值端点检测方法是正交匹配追踪算法迭代执行过程中所产生的预测残差的基础上实现。
3.如权利要求1所述的一种多模态情感识别方法,其特征在于,所述获取短时语音帧的观测值,通过利用离散余弦变换完成语音帧的稀疏性变换,以高斯随机矩阵为观测矩阵,获取语音帧的观测值。
4.如权利要求1所述的一种多模态情感识别方法,其特征在于,所述残差条件熵的计算公式为:
其中,rt是第t次迭代所获得的重建残差,At是OMP算法第t次迭代过程中由传感矩阵的原子构成的支撑集,为第t次迭代过程的中最小二乘法计算的估计值;At-1是OMP算法第t-1次迭代过程中由传感矩阵的原子构成的支撑集,为t-1次迭代过程中最小二乘法计算的估计值。
5.如权利要求1所述的一种多模态情感识别方法,其特征在于,所述基于语音的端点检测结果对情感图像分量中的情感图像进行筛选,剔除情感图像分量中无声段的情感图像,包括以下步骤:
根据语音端点检测结果,进行图像筛选,若该帧语音为有声段,则保留对应时间段的视频图像并利用面部检测算法,获取面部表情图像;若该帧语音为无声段,则抛弃对应时间段的视频图像;并对有效的面部表情图像进行存储。
6.如权利要求1所述的一种多模态情感识别方法,其特征在于,所述重建后的情感语音分量的特征提取步骤为:根据语音端点检测结果,基于有声段语音帧进行特征提取,通过时频域及谱分析得到情感语音分量的特征。
7.一种多模态情感识别系统,其特征在于,包括:
数据获取模块,其用于提取情感视频中的情感语音分量及情感图像分量,并分别存储;
端点检测模块,其用于利用情感语音残差条件熵差值端点检测方法对所述情感语音分量进行端点检测,获得每帧语音的端点检测结果;
图像筛选模块,其用于基于情感语音分量的端点检测结果对情感图像分量中的情感图像进行筛选,剔除情感图像分量中无声段的情感图像;
特征提取模块,其用于分别对重建后的情感语音分量和筛选后的情感图像分量进行特征提取;
模型训练模块,其用于对情感语音分量的特征与情感图像分量的特征进行融合,并通过融合特征对情感识别模型进行训练;
情感识别模块,其用于利用训练好的情感识别模型实现多模态的情感识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学;山东思正信息科技有限公司,未经济南大学;山东思正信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333007.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:地铁乘坐提醒方法及装置
- 下一篇:一种长寿命轻质化的磁流体动密封装置





