[发明专利]语音情绪识别方法、装置及存储介质在审
申请号: | 201910875372.1 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110556130A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 占小杰;方豪;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30 |
代理公司: | 11327 北京鸿元知识产权代理有限公司 | 代理人: | 李玉琦;曹素云 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情绪识别 语音 语音片段 多帧 情绪 人工智能技术 预处理 存储介质 准确率 分帧 减小 预测 | ||
本发明属于人工智能技术领域,公开了一种语音情绪识别方法、装置及存储介质,其中,方法包括:获取待识别语音片段;对获取的待识别语音片段进行预处理,包括:对所述待识别语音片段进行分帧处理,得到多帧语音;用预先训练生成的情绪识别模型对所述多帧语音进行处理,以得出多个情绪识别结果,每个情绪识别结果与一帧语音或设定数量帧语音相对应;根据所述多个情绪识别结果得到与所述待识别语音片段对应的情绪。本发明通过得到与每一帧或多帧语音对应的情绪,将对语音的情绪识别减小到毫秒级,更加接近对语音片段情绪的实时连续预测,提高语音情绪识别的准确率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音情绪识别方法、装置及存储介质。
背景技术
随着人工智能、机器学习与网络信息的快速发展,很多场合都应用到对语音进行情绪识别预测的技术,例如,人机交互、语音通话等。语音情绪识别预测是一个有强烈主观性的问题,其判断必须依据上下文。现有的语音情绪识别均是直接基于语音片段给定情绪预测结果,片段时长与说话人连续说话时长相关。但是,即使在一句话中,语音的情绪也是存在波动的,所以基于语音片段进行的情绪判断存在较大的误差。
发明内容
本发明提供一种语音情绪识别方法、装置及存储介质,以解决现有技术对语音片段进行情绪识别存在较大误差的问题。
为了实现上述目的,本发明的一个方面是提供一种语音情绪识别方法,包括以下步骤:
获取待识别语音片段;
对获取的待识别语音片段进行预处理,包括:对所述待识别语音片段进行分帧处理,得到多帧语音;
用预先训练生成的情绪识别模型对所述多帧语音进行处理,以得出多个情绪识别结果,每个情绪识别结果与一帧语音或设定数量帧语音相对应;
根据所述多个情绪识别结果得到与所述待识别语音片段对应的情绪。
优选地,在所述用预先训练生成的情绪识别模型对所述多帧语音进行处理之前,还包括:
构建样本库,并对所述样本库中的样本标注标签,所述样本为语音片段;
将样本库划分为训练集和测试集,并将所述训练集划分为开发集和验证集,开发集用于训练模型,验证集用于调优模型,所述测试集用于测试模型;
利用所述训练集中的训练样本训练所述情绪识别模型的超参数,以获取符合预设条件的超参数集,并根据所述超参数集更新所述情绪识别模型;
利用所述测试集中的测试样本对更新后的所述情绪识别模型进行测试,若生成的测试结果未通过验证,则继续执行所述利用所述训练集中的训练样本训练所述情绪识别模型的超参数的步骤。
优选地,利用所述训练集中的训练样本训练所述情绪识别模型的超参数,以获取符合预设条件的超参数集,并根据所述超参数集更新所述情绪识别模型,包括:
将训练集中的训练样本平均分成预设数目份训练子集;
依次取第i份训练子集作为验证集,其余训练子集作为开发集,对所述情绪识别模型进行预设数目轮训练,并得出预设数目组超参数集;
根据预设超参数集选择条件从所述预设数目组超参数集中选取出最优超参数集;
根据所述最优超参数集更新所述情绪识别模型,并继续执行所述将训练集中的训练样本平均分成预设数目份训练子集的步骤,直至所述最优超参数集符合预设条件。
优选地,利用训练集中的训练样本训练情绪识别模型的超参数的步骤包括:
初始化所述情绪识别模型的超参数并生成初始化情绪识别模型;
用所述初始化情绪识别模型对所述训练集中的训练样本进行处理,得出与每个训练样本对应的预测类别标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875372.1/2.html,转载请声明来源钻瓜专利网。