[发明专利]唤醒词识别方法、装置、电子设备及存储介质在审
| 申请号: | 202111559802.2 | 申请日: | 2021-12-20 | 
| 公开(公告)号: | CN114299927A | 公开(公告)日: | 2022-04-08 | 
| 发明(设计)人: | 李良斌;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 | 
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22 | 
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 王静 | 
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 唤醒 识别 方法 装置 电子设备 存储 介质 | ||
1.一种唤醒词识别方法,其特征在于,所述方法包括:
获取多个唤醒词语音正样本,每个唤醒词语音正样本包含一个唤醒词;
通过调用唤醒词识别模型对所述多个唤醒词语音正样本进行识别,获取每个唤醒词对应的近音词,所述近音词为与唤醒词的发音相同或相近的词语;
基于每个唤醒词对应的近音词,生成多个唤醒词语音负样本;
基于所述多个唤醒词语音正样本和所述多个唤醒词语音负样本,对所述唤醒词识别模型进行训练,得到训练后的唤醒词识别模型,所述训练后的唤醒词识别模型用于对任一语音信息进行唤醒词识别。
2.根据权利要求1所述的方法,其特征在于,所述通过调用唤醒词识别模型对所述多个唤醒词语音正样本进行识别,获取每个唤醒词对应的近音词,包括:
基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径;
基于所述语音解码网络,对多个非唤醒词语音进行语音解码,得到每个非唤醒词对应的解码路径;
根据每个唤醒词对应的多条解码路径和每个非唤醒词对应的解码路径,获取每个唤醒词对应的近音词。
3.根据权利要求2所述的方法,其特征在于,所述基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径之前,还包括:
调大所述唤醒词识别模型的路径选择参数的参数值,所述路径选择参数用于确定每个唤醒词在所述语音解码网络中的解码路径;
所述基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径,包括:
基于所述语音解码网络,对包含任一唤醒词的唤醒词语音正样本进行语音解码,得到所述唤醒词对应的多条候选路径及每条候选路径的路径分数;
从所述多条候选路径中,获取路径分数最高的候选路径,作为所述唤醒词的最佳解码路径;
对于除所述最佳解码路径以外的任一条候选路径,如果所述最佳解码路径的路径分数与所述候选路径的路径分数之间的差值小于调节后的路径选择参数的参数值,则将所述候选路径作为所述唤醒词的解码路径。
4.根据权利要求2所述的方法,其特征在于,所述根据每个唤醒词对应的解码路径和每个非唤醒词对应的解码路径,获取每个唤醒词对应的近音词,包括:
当任一非唤醒词对应的解码路径与任一唤醒词对应的任一解码路径相同,则将所述非唤醒词确定为所述唤醒词的近音词。
5.根据权利要求2所述的方法,其特征在于,所述根据每个唤醒词对应的多条解码路径和每个非唤醒词对应的多条解码路径,获取每个唤醒词对应的相近词,包括:
当任一非唤醒词对应的解码路径的路径分数与任一唤醒词对应的任一解码路径的路径分数之间的差值小于预设阈值,则将所述非唤醒词确定为所述唤醒词的近音词。
6.根据权利要求1所述的方法,其特征在于,所述基于每个唤醒词对应的近音词,生成多个唤醒词语音负样本,包括:
基于每个唤醒词对应的近音词,获取每个唤醒词对应的近音词语音负样本;
将每个唤醒对应的近音词语音负样本和多个随机语音负样本,组成为所述多个唤醒词语音负样本。
7.根据权利要求6所述的方法,其特征在于,所述基于每个唤醒词对应的近音词,获取每个唤醒词对应的近音词语音负样本,包括:
根据每个唤醒词对应的近音词数量,确定每个唤醒词对应的近音词语音负样本的获取比例;
根据每个唤醒词对应的近音词语音负样本的获取比例和需要获取的唤醒词语音负样本的总数量,获取每个唤醒词对应的近音词语音负样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111559802.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:飞行动作智能识别方法
 - 下一篇:一种OLED显示面板和OLED显示装置
 





