[发明专利]语音情绪识别方法、装置及存储介质在审
申请号: | 201910875372.1 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110556130A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 占小杰;方豪;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30 |
代理公司: | 11327 北京鸿元知识产权代理有限公司 | 代理人: | 李玉琦;曹素云 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情绪识别 语音 语音片段 多帧 情绪 人工智能技术 预处理 存储介质 准确率 分帧 减小 预测 | ||
1.一种语音情绪识别方法,应用于电子装置,其特征在于,包括以下步骤:
获取待识别语音片段;
对获取的待识别语音片段进行预处理,包括:对所述待识别语音片段进行分帧处理,得到多帧语音;
用预先训练生成的情绪识别模型对所述多帧语音进行处理,以得出多个情绪识别结果,每个情绪识别结果与一帧语音或设定数量帧语音相对应;
根据所述多个情绪识别结果得到与所述待识别语音片段对应的情绪。
2.根据权利要求1所述的语音情绪识别方法,其特征在于,在所述用预先训练生成的情绪识别模型对所述多帧语音进行处理之前,还包括:
构建样本库,并对所述样本库中的样本标注标签,所述样本为语音片段;
将样本库划分为训练集和测试集,并将所述训练集划分为开发集和验证集,开发集用于训练模型,验证集用于调优模型,所述测试集用于测试模型;
利用所述训练集中的训练样本训练所述情绪识别模型的超参数,以获取符合预设条件的超参数集,并根据所述超参数集更新所述情绪识别模型;
利用所述测试集中的测试样本对更新后的所述情绪识别模型进行测试,若生成的测试结果未通过验证,则继续执行所述利用所述训练集中的训练样本训练所述情绪识别模型的超参数的步骤。
3.根据权利要求2所述的语音情绪识别方法,其特征在于,利用所述训练集中的训练样本训练所述情绪识别模型的超参数,以获取符合预设条件的超参数集,并根据所述超参数集更新所述情绪识别模型,包括:
将训练集中的训练样本平均分成预设数目份训练子集;
依次取第i份训练子集作为验证集,其余训练子集作为开发集,对所述情绪识别模型进行预设数目轮训练,并得出预设数目组超参数集;
根据预设超参数集选择条件从所述预设数目组超参数集中选取出最优超参数集;
根据所述最优超参数集更新所述情绪识别模型,并继续执行所述将训练集中的训练样本平均分成预设数目份训练子集的步骤,直至所述最优超参数集符合预设条件。
4.根据权利要求2或3所述的语音情绪识别方法,其特征在于,利用训练集中的训练样本训练情绪识别模型的超参数的步骤包括:
初始化所述情绪识别模型的超参数并生成初始化情绪识别模型;
用所述初始化情绪识别模型对所述训练集中的训练样本进行处理,得出与每个训练样本对应的预测类别标签;
根据所述预测类别标签与标注标签计算迭代损失值;
根据所述迭代损失值更新所述初始化情绪识别模型的超参数,
其中,迭代损失值通过下式获取:
其中,L表示迭代损失值,y(i)表示样本i的标注标签,表示样本i的预测类别标签,N表示样本总数量。
5.根据权利要求2所述的语音情绪识别方法,其特征在于,利用所述测试集中的测试样本对更新后的所述情绪识别模型进行测试,包括:利用所述测试样本测试所述情绪识别模型,并得出所述情绪识别模型的情绪识别准确率,若所述准确率小于或等于预设准确率,则所述情绪识别模型未通过验证,否则,所述情绪识别模型通过验证。
6.根据权利要求1所述的语音情绪识别方法,其特征在于,根据所述多个情绪识别结果得到与所述待识别语音片段对应的情绪的步骤,包括:
获取所述多个情绪识别结果中,负面情绪所占的比例;
若负面情绪所占的比例大于或等于预设比例阈值,则判定与所述待识别语音片段对应的情绪为负面;若负面情绪所占的比例小于预设比例阈值,则判定与所述待识别语音片段对应的情绪为非负面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875372.1/1.html,转载请声明来源钻瓜专利网。