[发明专利]语音唤醒模型的训练方法、装置、电子设备及存储介质有效
| 申请号: | 202010335105.8 | 申请日: | 2020-04-24 |
| 公开(公告)号: | CN111508481B | 公开(公告)日: | 2022-11-08 |
| 发明(设计)人: | 戚萌;张维城;董斐;潘思伟;陈皓;林福辉 | 申请(专利权)人: | 展讯通信(上海)有限公司 |
| 主分类号: | G10L15/14 | 分类号: | G10L15/14 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
| 地址: | 201203 上海市浦东新区张*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 唤醒 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种语音唤醒模型的训练方法,其特征在于,包括:
确定唤醒词对应的待训练的关键词集,并对所述待训练的关键词集进行预处理,以生成所述待训练的关键词集的特征序列集合;
通过所述特征序列集合对高斯混合模型GMM-隐马尔科夫模型HMM中的HMM进行初始化,并确定所述特征序列集合的初始分割方式;
根据所述特征序列集合和所述初始分割方式对GMM-HMM中的GMM进行参数估计,生成初始GMM-HMM;
根据所述特征序列集合、所述初始分割方式、Baum-Welch算法和Viterbi算法对所述初始GMM-HMM进行训练,以获取训练后的基于所述唤醒词的所述语音唤醒模型;
在语音唤醒模型训练次数为1次时,根据所述特征序列集合、所述初始分割方式、Baum-Welch算法和Viterbi算法对所述初始GMM-HMM进行训练,以获取训练后的基于所述唤醒词的所述语音唤醒模型,包括:
将第j个GMM-HMM和所述特征序列集合中的第i段语料输入Baum-Welch算法进行训练,生成第j+1个GMM-HMM,并将所述第j+1个GMM-HMM和第i段语料输入所述Viterbi算法中,得到第j+1分割方式,若判断第j+1分割方式与第j分割方式不同,则将j的值加1,并重复执行本步骤,直到判断第j+1分割方式与第j分割方式相同;
将i加1,并根据所述特征序列集合和更新后的初始分割方式对第j+1个GMM-HMM中的GMM进行参数估计,生成更新后的初始GMM-HMM,更新后的初始分割方式为第j+1分割方式,基于更新后的初始GMM-HMM和所述加1后的i,重复执行上述步骤,直到将所述特征序列集合中的全部语料训练完毕,以获取所述语音唤醒模型;
其中,j和i初始为1,且为正整数;在j=1时,第1个GMM-HMM为所述初始GMM-HMM或更新后的初始GMM-HMM,且第1分割方式为所述初始分割方式或更新后的初始分割方式。
2.根据权利要求1所述的方法,其特征在于,在语音唤醒模型训练次数为N次,且在进行第N次语音唤醒模型训练时,在所述根据所述特征序列集合、所述初始分割方式、Baum-Welch算法和Viterbi算法对所述初始GMM-HMM进行训练,以获取训练后的基于所述唤醒词的所述语音唤醒模型之前,所述方法还包括:
更新初始分割方式为第N-1次语音唤醒模型训练完毕后的最后一个GMM-HMM的分割方式;
更新初始GMM-HMM为第N-1次语音唤醒模型训练完毕后的最后一个GMM-HMM;
其中,N大于或等于2,且为正整数。
3.根据权利要求2所述的方法,其特征在于,还包括:
确定所述第N次语音唤醒模型训练对应的第N次训练集概率分布,和所述第N-1次语音唤醒模型训练对应的第N-1次 训练集概率分布;所述训练集概率分布为对应的语音唤醒模型训练过程中每个分割方式确定时对应获取的概率值的集合;
根据所述第N次 训练集概率分布和所述第N-1次 训练集概率分布,确定是否进行第N+1次语音唤醒模型训练。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第N次 训练集概率分布和所述第N-1次 训练集概率分布,确定是否进行第N+1次语音唤醒模型训练,包括:
所述第N-1次 训练集概率分布中的最小概率值与所述第N次 训练概率分布中的最小概率值之间的相差数值大于第一预设阈值时,确定进行所述第N+1次语音唤醒模型训练;
和/或,
所述第N-1次 训练集概率分布中的全部概率值之和,与所述第N次 训练集概率分布中的全部概率值之和的相差数值大于第二预设阈值时,确定进行所述第N+1次语音唤醒模型训练。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
获取待识别的语音;
根据训练后的语音唤醒模型对所述待识别的语音中的关键词进行识别,并在识别到所述关键词时,执行与所述关键词对应的处理操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010335105.8/1.html,转载请声明来源钻瓜专利网。





