[发明专利]语种识别方法、装置、设备及存储介质在审
| 申请号: | 202110593396.5 | 申请日: | 2021-05-28 |
| 公开(公告)号: | CN113327584A | 公开(公告)日: | 2021-08-31 |
| 发明(设计)人: | 秦冲;魏韬;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/16;G10L15/06;G10L15/02 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
| 地址: | 518057 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语种 识别 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能和语音识别领域,具体公开了一种语种识别方法、装置、设备及存储介质,所述方法包括:获取样本音频和样本音频对应的音频标签;对样本音频进行数据处理,得到样本音频对应的特征矩阵;将特征矩阵输入第一神经网络,得到特征矩阵对应的帧内特征;将特征矩阵输入第二神经网络,得到特征矩阵对应的帧间特征;根据帧内特征和帧间特征进行逻辑回归,以对样本音频进行语种识别,得到样本音频的预测类别;基于样本音频的预测类别和音频标签对第一神经网络和第二神经网络进行迭代训练,并将训练完成的第一神经网络和训练完成的第二神经网络合并得到语种识别模型,并基于语种识别模型对待识别语音进行语种识别。提高了语种识别的准确率。
技术领域
本申请涉及语种识别领域,尤其涉及一种语种识别方法、装置、设备及存储介质。
背景技术
随着人工智能的发展和国际化程度的提高,语音识别和机器翻译等行业对于语种识别的要求也越来越高。可以根据每种语种不同的发音节奏、声韵母、语言结构和发音习惯来对音频进行语种识别。目前大多是利用深度学习方法的说话人识别技术为主来对音频进行识别,但这种深度学习方法在进行语种识别时的准确率有限,尤其是在短语音方面的识别效果较差,难以满足实际业务的需要,因此,如何提高语种的识别准确率成为亟待解决的问题。
发明内容
本申请提供了一种语种识别方法、装置、设备及存储介质,以提高语种识别的准确率。
第一方面,本申请提供了一种语种识方法,所述方法包括:
获取样本音频和所述样本音频对应的音频标签;对所述样本音频进行数据处理,得到所述样本音频对应的特征矩阵;将所述特征矩阵输入第一神经网络,得到所述特征矩阵对应的帧内特征;将所述特征矩阵输入第二神经网络,得到所述特征矩阵对应的帧间特征;根据所述帧内特征和所述帧间特征进行逻辑回归,以对所述样本音频进行语种识别,得到所述样本音频的预测类别;基于所述样本音频的预测类别和所述音频标签对所述第一神经网络和所述第二神经网络进行迭代训练,并将训练完成的第一神经网络和训练完成的第二神经网络合并得到语种识别模型,并基于所述语种识别模型对待识别语音进行语种识别。
第二方面,本申请还提供了一种语种识别装置,所述装置包括:
样本获取模块,用于获取样本音频和所述样本音频对应的音频标签;矩阵生成模块,用于对所述样本音频进行数据处理,得到所述样本音频对应的特征矩阵;帧内提取模块,用于将所述特征矩阵输入第一神经网络,得到所述特征矩阵对应的帧内特征;帧间提取模块,用于将所述特征矩阵输入第二神经网络,得到所述特征矩阵对应的帧间特征;类别预测模块,用于根据所述帧内特征和所述帧间特征进行逻辑回归,以对所述样本音频进行语种识别,得到所述样本音频的预测类别;迭代训练模块,用于基于所述样本音频的预测类别和所述音频标签对所述第一神经网络和所述第二神经网络进行迭代训练,并将训练完成的第一神经网络和训练完成的第二神经网络合并得到语种识别模型,并基于所述语种识别模型对待识别语音进行语种识别。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的语种识别方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的语种识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110593396.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音合成方法、装置、设备及存储介质
- 下一篇:显示面板及显示装置





