[发明专利]一种基于Kaldi的中文语音识别声学模型构建方法在审
| 申请号: | 202010381931.6 | 申请日: | 2020-05-08 |
| 公开(公告)号: | CN111696525A | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 于健;李亚蓉;王建荣;喻梅;徐天一;高洁;马佳轩 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/07;G10L15/14 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 张义 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 kaldi 中文 语音 识别 声学 模型 构建 方法 | ||
1.一种基于Kaldi的中文语音识别声学模型构建方法,其特征在于,包含以下步骤:
步骤一:获得语料集的音频集和对应的文字集;
步骤二:将获得的文字集格式化;
步骤三:从音频集中提取声学特征;
步骤四:单音素训练;
步骤五:基于高斯混合模型-隐马尔科夫模型和深度神经网络-隐马尔科夫模型的框架,进行如下动作:
5.1将音频集根据声学模型对齐;
5.2训练三音素模型;
5.3根据声学模型重新对齐音频重新训练三音素模型。
2.根据权利要求1所述的一种基于Kaldi的中文语音识别声学模型构建方法,其特征在于,步骤五中5.3具体包括如下步骤:
重复上述5.1和5.2步骤,并加入额外更精细的三音素模型训练,通常包括隐含狄利克雷分布、最大似然准则MLLT变换以及说话人自适应训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010381931.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种烟熏鱿鱼的发烟装置
- 下一篇:发光模组及其制造方法与电子设备





