[发明专利]语音情感识别方法、装置、电子设备和存储介质在审
申请号: | 202310395286.7 | 申请日: | 2023-04-13 |
公开(公告)号: | CN116386674A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 摩尔线程智能科技(北京)有限责任公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L15/06 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 李茂家;周蕾 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种语音情感识别方法、装置、电子设备和存储介质。所述方法包括:获得预训练的语音情感识别模型,其中,所述语音情感识别模型包括第一模块和第二模块;获取目标用户对应的第一语音样本集,其中,所述第一语音样本集包括所述目标用户输入的多个第一语音样本,以及与所述多个第一语音样本对应的多个情感分类标签;对于所述第一语音样本集中的任一第一语音样本,获得所述第一语音样本对应的语音特征;将所述第一语音样本对应的语音特征输入所述第二模块,得到所述第一语音样本对应的情感分类预测结果;根据所述第一语音样本对应的情感分类预测结果和所述第一语音样本对应的情感分类标签,更新所述第二模块的参数。
技术领域
本公开涉及计算机技术领域,尤其涉及一种语音情感识别方法、语音情感识别装置、电子设备和存储介质。
背景技术
语音是人们在日常生活中交流的主要媒介,它不仅能够传达思想,还能够表达说话人的情感状态。通过语音情感识别,可以检测用户的心理健康,并且,可以在不同的场景(例如,数字人、机器人客服等场景)中基于用户的情感变化进行相应的反馈和回复等。语音情感识别也利于家长关注孩子的心理健康等指标。因此,进行准确的语音情感识别具有重要意义。
发明内容
本公开提供了一种语音情感识别技术方案。
根据本公开的一方面,提供了一种语音情感识别模型的训练方法,包括:
获得预训练的语音情感识别模型,其中,所述语音情感识别模型包括第一模块和第二模块;
获取目标用户对应的第一语音样本集,其中,所述第一语音样本集包括所述目标用户输入的多个第一语音样本,以及与所述多个第一语音样本对应的多个情感分类标签;
对于所述第一语音样本集中的任一第一语音样本,获得所述第一语音样本对应的语音特征;
将所述第一语音样本对应的语音特征输入所述第二模块,得到所述第一语音样本对应的情感分类预测结果;
根据所述第一语音样本对应的情感分类预测结果和所述第一语音样本对应的情感分类标签,更新所述第二模块的参数。
在一种可能的实现方式中,
所述方法还包括:获得训练完成的说话人识别模型;
所述对于所述第一语音样本集中的任一第一语音样本,获得所述第一语音样本对应的语音特征,包括:对于所述第一语音样本集中的任一第一语音样本,通过所述第一模块和/或所述说话人识别模型,得到所述第一语音样本对应的语音特征。
在一种可能的实现方式中,所述获得预训练的语音情感识别模型,包括:
获取第二语音样本集,其中,所述第二语音样本集包括多个说话人对应的多个第二语音样本,以及与所述多个第二语音样本对应的多个情感分类标签;
采用所述第二语音样本集训练所述语音情感识别模型,直至满足第一预设训练条件;
对于第二语音样本集中的任一第二语音样本,通过所述第一模块和/或说话人识别模型,得到所述第二语音样本对应的语音特征;
将所述第二语音样本对应的语音特征输入所述第二模块,得到所述第二语音样本对应的情感分类预测结果;
根据所述第二语音样本对应的情感分类预测结果和第二所述语音样本对应的情感分类标签,更新所述第二模块的参数。
在一种可能的实现方式中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩尔线程智能科技(北京)有限责任公司,未经摩尔线程智能科技(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310395286.7/2.html,转载请声明来源钻瓜专利网。