[发明专利]一种自动过滤唤醒词的方法及系统有效
申请号: | 201811378486.7 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109360552B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/18;G10L15/26 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 过滤 唤醒 方法 系统 | ||
本发明提供了一种自动过滤唤醒词的方法及系统,其方法包括:获取唤醒词以及对应的唤醒词音频;获取包含所述唤醒词的语料样本,根据所述语料样本和所述唤醒词音频建立语音模型;获取用户语音;将所述用户语音和所述唤醒词音频进行对比,得到所述用户语音中的用户唤醒词、用户唤醒词位置以及用户唤醒词情况;将所述用户唤醒词、所述用户唤醒词位置以及所述用户唤醒词情况和所述语音模型进行匹配,得到所述用户唤醒词中需要屏蔽的无意义唤醒词;屏蔽所述用户语音中的所述无意义唤醒词得到无唤醒词语音;解析所述无唤醒词语音得到用户语义。本发明通过屏蔽用户语音中的无意义唤醒词,识别生成的无唤醒词语音,提升语义解析的准确率。
技术领域
本发明涉及语音识别技术领域,尤指一种自动过滤唤醒词的方法及系统。
背景技术
随着互联网的快速发展,人们的生活变得越来越智能化,因此人们也越来越习惯地使用智能终端完成各种需求。而且随着人工智能相关技术的日益成熟,各类终端的智能化程度也越来越高。其中,语音交互的方式作为智能终端中人机交互主流的交流应用之一,也是越来越受到用户的青睐。
智能终端都是基于用户输入的语音进行识别,然后采取相应的措施,因此用户通过终端终端所输入的语音的准确性严重影响着智能终端所作出的反馈。
智能终端如果通过语音交互的方式进行开启,那么在启动过程中需要用到唤醒词,当智能终端识别到设定的唤醒词时就会启动,然后识别用户语音。
但是,智能终端获取的用户语音中可能存在多个唤醒词,其中部分唤醒词仅作为唤醒智能终端,部分具有实际意义,但是智能终端并无法智能识别,可能都当做无意义的唤醒词处理,从而导致智能终端对用户语音解析出错。
另外,由于环境等因素影响或者用户自身的原因,智能终端获取的用户语音中唤醒词可能出现不全的情况,例如唤醒词为五个字,但是由于环境嘈杂或者用户过于紧张,从而导致获取到的用户语音中中只有设定的唤醒词中其中四个字,那么智能终端可能不会将其识别为无意义的唤醒词,这种情况下,一方面可能无法及时地唤醒智能终端,另一方面可能将补全的唤醒词当做有实质意义的词语进行语义识别,从而导致智能终端对用户语音解析出错。
因此,针对上述唤醒词重复或者补全的情况,急需一种自动过滤唤醒词的方法及系统。
发明内容
本发明的目的是提供一种自动过滤唤醒词的方法及系统,实现通过屏蔽用户语音中的无意义唤醒词,识别生成的无唤醒词语音,从而提升语义解析的准确率。
本发明提供的技术方案如下:
本发明提供一种自动过滤唤醒词的方法,包括:
获取唤醒词以及对应的唤醒词音频;
获取包含所述唤醒词的语料样本,根据所述语料样本和所述唤醒词音频建立语音模型;
获取用户语音;
将所述用户语音和所述唤醒词音频进行对比,得到所述用户语音中的用户唤醒词、用户唤醒词位置以及用户唤醒词情况;
将所述用户唤醒词、所述用户唤醒词位置以及所述用户唤醒词情况和所述语音模型进行匹配,得到所述用户唤醒词中需要屏蔽的无意义唤醒词;
屏蔽所述用户语音中的所述无意义唤醒词得到无唤醒词语音;
解析所述无唤醒词语音得到用户语义;
进一步的,所述的获取唤醒词以及对应的唤醒词音频具体包括:
获取唤醒词以及对应的唤醒词音频;
将所述唤醒词中的单字位置在所述唤醒词音频中进行标记定位。
进一步的,所述的获取包含所述唤醒词的语料样本,根据所述语料样本和所述唤醒词音频建立语音模型具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811378486.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及装置
- 下一篇:一种用于语音识别的时延递归神经网络