[发明专利]语音识别装置、方法、电子设备和计算机可读存储介质在审
申请号: | 201910364997.1 | 申请日: | 2019-04-30 |
公开(公告)号: | CN111862944A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 罗讷;赵帅江;赵茜 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16;G10L15/22;G10L15/26;G10L15/30 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 电子设备 计算机 可读 存储 介质 | ||
1.一种语音识别装置,其特征在于,该装置包括:
获取模块,用于获取服务请求端与服务提供端之间的具有地域化语言风格的语音内容;
特征提取模块,用于对所述获取模块获取的所述具有地域化语言风格的语音内容进行特征提取,得到所述语音内容对应的具有地域化语言风格的声学特征向量;
转化模块,用于将所述特征提取模块得到的所述具有地域化语言风格的声学特征向量输入到预先训练的目标语音识别模型中,将所述语音内容转化为文本信息。
2.如权利要求1所述的语音识别装置,其特征在于,所述转化模块具体用于:
将所述文本信息中的第i个文字对应的特征向量和所述具有地域化语言风格的声学特征向量输入到目标语音识别模型中,得到第i+1个文字,其中,i为大于或等于0的正整数,第i+1个文字为在第i个文字之后的一个文字。
3.如权利要求1所述的语音识别装置,其特征在于,所述转化模块具体用于:
将所述具有地域化语言风格的声学特征向量输入到所述目标语音识别模型的编码器中进行上下文关系特征提取,得到所述语音内容对应的特征提取向量;
将所述文本信息中的第i个文字对应的特征向量和所述特征提取向量输入到目标语音识别模型的解码器中,得到第i+1个文字。
4.如权利要求1所述的语音识别装置,其特征在于,该装置还包括:训练模块,所述训练模块用于:
构建训练样本库,所述训练样本库中包括具有地域化语言风格的样本语音内容和人工标注的真实文本信息;
将所述样本语音内容对应的具有地域化语言风格的样本声学特征向量和对应的真实文本信息中的第j个文字输入到初始目标语音识别模型中,得到所述样本语音内容对应的第j+1个预测文字,其中,j为大于或等于0的正整数,第j+1个预测文字为在第j个预测文字之后的一个预测文字;
根据所述样本语音内容对应的所有预测文字和所述真实文本信息,对所述初始目标语音识别模型进行调整,得到调整后的目标语音识别模型。
5.如权利要求4所述的语音识别装置,其特征在于,所述训练模块具体用于:
将所述样本语音内容对应的具有地域化语言风格的样本声学特征向量输入到所述初始目标语音识别模型的初始编码器中进行上下文关系特征提取,得到所述样本语音内容对应的样本特征提取向量;
将所述样本语音内容对应的样本特征提取向量和对应的真实文本信息中的第j个文字对应的特征向量输入到所述初始目标语音识别模型的初始解码器中,得到所述样本语音内容对应的第j+1个预测文字。
6.如权利要求4所述的语音识别装置,其特征在于,所述训练模块具体用于:
按照所述样本语音内容对应的所有预测文字和所述真实文本信息之间的距离最小原则,分别对所述初始目标语音识别模型的模型结构和模型参数进行调整,得到调整后的目标语音识别模型。
7.如权利要求1所述的语音识别装置,其特征在于,所述特征提取模块具体用于:
对所述语音内容进行分帧处理;
对分帧处理后的语音内容进行预加重处理;
对预加重处理后的语音内容进行去除直流偏移处理;
对去除直流偏移处理后的语音内容进行加窗处理;
对加窗处理后的语音内容进行补零处理;
对补零处理后的语音内容进行快速傅里叶变换处理;
对快速傅里叶变换处理后的语音内容进行滤波处理,得到所述语音内容对应的声学特征向量;
对所述服务请求端对应的地域特征向量、所述服务提供端对应的地域特征向量、和所述语音内容对应的声学特征向量进行拼接处理,得到所述语音内容对应的具有地域化语言风格的声学特征向量。
8.如权利要求7所述的语音识别装置,其特征在于,所述服务请求端对应的地域特征向量为基于所述服务请求端对应的服务请求方的地域属性信息生成的,所述服务提供端对应的地域特征向量为基于所述服务提供端对应的服务提供方的地域属性信息生成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910364997.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:包装秤进料装置
- 下一篇:一种时间序列信号的分类方法、装置以及电子设备