[发明专利]一种语音应答方法、装置和存储介质有效
| 申请号: | 202010098634.0 | 申请日: | 2020-02-18 |
| 公开(公告)号: | CN111312245B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 王超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/06;G10L15/02;G10L15/04;G10L15/08;G10L25/12;G10L25/18;G10L25/51;G10L25/63;G06F40/30 |
| 代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 蔡艾莹 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 应答 方法 装置 存储 介质 | ||
1.一种语音应答方法,其特征在于,包括:
获取用户输入的语音信息;
提取所述语音信息的音频特征信息,并基于预设情感声学参数和所述音频特征信息,生成所述语音信息的情感声学特征信息;所述情感声学特征信息是与情感相关的声学特征;
根据所述语音信息的音频特征信息,获取所述语音信息对应的文本信息,并提取所述文本信息的语义特征信息;
根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型;
基于所述情感类型,获取所述语音信息对应的应答内容;
其中,所述基于预设情感声学参数和所述音频特征信息,生成所述语音信息的情感声学特征信息,包括:根据所述音频特征信息,获取所述预设情感声学参数对应的目标声学参数;将所述目标声学参数与所述预设情感声学参数进行比较,得到比较结果;根据比较结果,生成所述语音信息的情感声学特征信息;
所述根据所述情感声学特征信息和所述语义特征信息,获取所述语音信息的情感类型,包括:根据情感识别模型,将所述语义特征信息和所述情感声学特征信息进行融合,得到所述语音信息的情感特征信息;基于所述情感识别模型对所述情感特征信息进行全连接运算,得到情感类型对应的概率信息;根据所述概率信息,确定所述语音信息的情感类型。
2.如权利要求1所述的语音应答方法,其特征在于,所述情感识别模型是通过如下的步骤训练的:
获取多个标注有真实情感类型的样本对,所述样本对包括语音信息样本,以及所述语音信息样本对应的文本信息样本;
提取所述语音信息样本的声学特征信息,并提取所述文本信息样本的语义特征信息;
通过预设初始情感识别模型,对所述情感声学特征信息和所述语义特征信息进行融合,获取所述语音信息样本的情感类型预测值;
对比所述情感类型预测值与所述真实情感类型,确定预测结果;
采用损失函数对所述预设初始情感识别模型进行收敛,直至所述预测结果为预测正确,得到训练后的情感识别模型。
3.如权利要求1所述的语音应答方法,其特征在于,所述提取所述语音信息的音频特征信息,包括:
对所述语音信息进行划分,得到音频帧;
提取所述音频帧进行特征提取,得到所述语音信息的音频特征信息。
4.如权利要求3所述的语音应答方法,其特征在于,所述根据所述语音信息的音频特征信息,获取所述语音信息对应的文本信息,包括:
根据预设声学模型,获取所述音频特征信息对应的音素;
根据预设语言模型,对所述音素和预设字典进行比较与匹配,得到所述音素对应的文本单词;
提取所述文本单词之间的语义关联信息,根据所述关联信息,将所述文本单词组合得到文本信息。
5.如权利要求4所述的语音应答方法,其特征在于,所述语义特征信息包括语义特征向量,所述提取所述文本信息的语义特征信息,包括:
对所述文本信息进行划分,得到至少一个文本片段;
预设语义特征提取模型内的预设字典,将所述文本片段映射为片段特征向量,其中所述语义特征提取模型是基于循环神经网络的模型;
根据所述片段特征向量及语义特征提取模型特征提取时刻的隐层状态,生成语义特征向量。
6.如权利要求5所述的语音应答方法,其特征在于,所述根据所述片段特征向量及语义特征提取模型特征提取时刻的隐层状态,生成语义特征向量,包括:
确定所述语义特征提取模型中当前特征提取时刻的上一时刻,获取所述上一时刻的向前隐层状态,根据所述片段特征向量和向前隐层状态计算所述当前特征提取时刻的向前隐层状态;
确定所述当前特征提取时刻的下一时刻,获取所述下一时刻的向后隐层状态,根据所述片段特征向量和向后隐层状态计算当前特征提取时刻的向后隐层状态;
根据所述当前特征提取时刻的向前隐层状态和向后隐层状态,计算得到语义特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098634.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多优先级用户频谱预测切换方法
- 下一篇:一种企业电商化数字采购平台





