[发明专利]一种语音应答方法、装置和存储介质有效
| 申请号: | 202010098634.0 | 申请日: | 2020-02-18 |
| 公开(公告)号: | CN111312245B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 王超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/06;G10L15/02;G10L15/04;G10L15/08;G10L25/12;G10L25/18;G10L25/51;G10L25/63;G06F40/30 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 蔡艾莹 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 应答 方法 装置 存储 介质 | ||
本申请实施例公开了一种语音应答方法、装置和存储介质,其中,本申请实施例可以获取用户输入的语音信息;提取所述语音信息的音频特征信息,并基于预设情感声学参数和所述音频特征信息,生成所述语音信息的情感声学特征信息;根据所述语音信息的音频特征信息,获取所述语音信息对应的文本信息,并提取所述文本信息的语义特征信息;根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型;基于所述情感类型,获取所述语音信息对应的应答内容。根据语音信息的情感类型,可以深度理解用户的需求,从而选择更合理的应答内容,可以安抚用户的情绪,提高用户体验。
技术领域
本申请涉及人工智能的技术领域,具体涉及一种语音应答方法、装置和存储介质。
背景技术
近年来,随着语音识别技术的发展,语音识别技术也被应用到多种场景,比如,智能语音客户服务系统,智能终端对话场景等。目前,可以应用语音识别(Automatic SpeechRecognition,ASR)技术,将用户输入的语音信息转化为文本信息,并通过自然语言处理(Natural Language Processing,NLP)技术,理解文本信息包含的领域信息和意图信息,根据文本信息包含的领域信息和意图关键词选择相应的应答内容。但是,这种应答方法对于用户的要求理解不够深入,应答内容过于死板,导致用户体验不佳。
发明内容
有鉴于此,本申请实施例提供了一种语音应答方法、装置和存储介质,可以安抚用户的情绪,提高用户的体验。
第一方面,本申请实施例提供了一种语音应答方法,包括:
获取用户输入的语音信息;
提取所述语音信息的音频特征信息,并基于预设情感声学参数和所述音频特征信息,生成所述语音信息的情感声学特征信息;
根据所述语音信息的音频特征信息,获取所述语音信息对应的文本信息,并提取所述文本信息的语义特征信息;
根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型;
基于所述情感类型,获取所述语音信息对应的应答内容。
在一实施例中,在所述根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型之前,还包括:
获取多张标注有真实情感类型的语音信息样本;
获取所述语音信息样本的声学特征信息和语义特征信息;
通过预设初始情感识别模型,对所述情感声学特征信息和所述语义特征信息进行融合,获取所述语音信息样本的情感类型预测值;
对比所述情感类型预测值与所述真实情感类型,确定预测结果;
采用损失函数对所述预设初始情感识别模型进行收敛,直至所述预测结果为预测正确,得到训练后的情感识别模型。
在一实施例中,所述根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型,包括:
根据所述训练后的情感识别模型,将所述语义特征信息和所述情感声学特征信息进行融合,得到所述语音信息的情感特征信息;
基于所述训练后的情感识别模型对所述情感特征信息进行全连接运算,得到情感类型对应的概率信息;
根据所述概率信息,确定所述语音信息的情感类型。
在一实施例中,所述基于预设情感声学参数和所述音频特征信息,生成所述语音信息的情感声学特征信息,包括:
根据所述音频特征信息,获取所述预设情感声学参数对应的目标声学参数;
将所述目标声学参数与所述预设情感声学参数进行比较,得到比较结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098634.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多优先级用户频谱预测切换方法
- 下一篇:一种企业电商化数字采购平台





