[发明专利]唤醒词识别方法、装置、电子设备及存储介质在审
| 申请号: | 202111559802.2 | 申请日: | 2021-12-20 |
| 公开(公告)号: | CN114299927A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 李良斌;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 王静 |
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 唤醒 识别 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种唤醒词识别方法、装置、电子设备及存储介质,属于互联网技术领域。所述方法包括:通过调用唤醒词识别模型对多个唤醒词语音正样本进行识别,获取每个唤醒词对应的近音词;基于每个唤醒词对应的近音词,生成多个唤醒词语音负样本;基于多个唤醒词语音正样本和多个唤醒词语音负样本,对唤醒词识别模型进行训练,得到训练后的唤醒词识别模型。本公开基于唤醒词识别模型对唤醒词语音正样本进行识别,获取包括唤醒词对应的近音词的唤醒词语音负样本,由于唤醒词语音负样本中包含了更多的近音词,因而所训练的唤醒词识别模型能够学习更多近音词的语音特征,从而能够准确地识别出唤醒词与其近音词,达到了更好地抑制近音词误唤醒的效果。
技术领域
本公开涉及人工智能技术领域,特别涉及一种唤醒词识别方法、装置、电子设备及存储介质。
背景技术
随着人工智能技术的发展以及智能语音设备的普及,越来越多的用户通过语音信息与智能语音设备进行人机交互。在人机交互过程中,智能语音设备对用户的语音信息进行识别,当识别出语音信息中包含唤醒词时,即可控制智能语音设备执行相应操作,例如,播放音乐、调节空调温度、设置闹铃等。
目前,相关技术对唤醒词进行识别时,主要采用如下方法:获取包含唤醒词的多个唤醒词语音正样本以及包含非唤醒词的多个唤醒词语音负样本;基于多个唤醒词语音正样本和多个唤醒词语音负样本,对唤醒词识别模型进行训练,得到训练的唤醒词识别模型;调用所训练的唤醒词识别模型,对语音信息进行识别,得到识别结果。
由于上述唤醒词语音负样本中包含的非唤醒词为随机采样到的,并未涵盖与唤醒词发音相近的近音词,导致所训练的唤醒词识别模型无法学习到近音词的语音特征,识别结果准确性较低,在实际应用中常常发生误唤醒现象。
发明内容
本公开实施例提供了一种唤醒词识别方法、装置、电子设备及存储介质,能够准确地识别出唤醒词及其近音词,提高了识别结果准确性,有效地避免了误唤醒现象发生。所述技术方案如下:
第一方面,提供了一种唤醒词识别方法,所述方法包括:
获取多个唤醒词语音正样本,每个唤醒词语音正样本包含一个唤醒词;
通过调用唤醒词识别模型对所述多个唤醒词语音正样本进行识别,获取每个唤醒词对应的近音词,所述近音词为与唤醒词的发音相同或相近的词语;
基于每个唤醒词对应的近音词,生成多个唤醒词语音负样本;
基于所述多个唤醒词语音正样本和所述多个唤醒词语音负样本,对所述唤醒词识别模型进行训练,得到训练后的唤醒词识别模型,所述训练后的唤醒词识别模型用于对任一语音信息进行唤醒词识别。
在本公开的另一个实施例中,所述通过调用唤醒词识别模型对所述多个唤醒词语音正样本进行识别,获取每个唤醒词对应的近音词,包括:
基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径;
根据每个唤醒词对应的多条解码路径和每个非唤醒词对应的解码路径,获取每个唤醒词对应的近音词。
在本公开的另一个实施例中,所述基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径之前,还包括:
调大所述唤醒词识别模型的路径选择参数的参数值,所述路径选择参数用于确定每个唤醒词在所述语音解码网络中的多条解码路径;
所述基于所述唤醒词识别模型对应的语音解码网络,对所述多个唤醒词语音正样本进行语音解码,得到每个唤醒词对应的多条解码路径,包括:
基于所述语音解码网络,对包含任一唤醒词的唤醒词语音正样本进行语音解码,得到所述唤醒词对应的多条候选路径及每条候选路径的路径分数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111559802.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:飞行动作智能识别方法
- 下一篇:一种OLED显示面板和OLED显示装置





