[发明专利]语音关键词识别方法、装置、设备及计算机可读存储介质有效

申请号：	201710855490.7	申请日：	2017-09-20
公开（公告）号：	CN107665705B	公开（公告）日：	2020-04-21
发明（设计）人：	查高密;程宁;王健宗;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/10	分类号：	G10L15/10;G10L15/14;G10L15/22;G10L15/26
代理公司：	深圳市精英专利事务所 44242	代理人：	林燕云
地址：	518000 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音关键词识别方法装置设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种语音关键词识别方法、装置、设备及计算机可读存储介质。所述语音关键词识别方法包括：接收输入的语音信号；提取语音信号中的音频特征；根据所述音频特征，利用声学模型、发音词典、语言模型计算关键词对于声学模型、发音词典、语言模型的概率；判断所述概率是否大于阈值，若所述概率大于阈值，统计所述概率对应的关键词的数量；若所述概率对应的关键词的数量为一个，将所述概率对应的关键词作为关键词识别的结果。本发明实施例当计算出可能的关键词的概率后，将概率中大于阈值的对应的一个关键词作为关键词识别的结果，提高了关键词的识别率。

技术领域

本发明涉及信息处理技术领域，尤其涉及一种语音关键词识别方法、装置、设备及计算机可读存储介质。

背景技术

一个通用的大词汇量连续语音识别系统(Large Vocabulary Continuous SpeechRecognition，LVCSR)进行语音关键词识别的过程是：先对语音进行识别，获得一个或多个可能的语句文本，然后在文本中搜索关键词。如果关键词在某个文本中出现，则认为语句中有关键词。一个通用的LVCSR系统使用的语言模型会试图捕捉自然语言的特点如自然语言中上下文之间的关系，从而识别出语言中较有可能出现的句子。在关键词识别的任务中，常常因为有多种可能的发音相近的语句，导致即使语句中出现了关键词，最有可能的一个或多个识别结果中也不包括关键词(因为它考虑了语言中上下文之间的关系)，尤其是关键词本身在语言中出现的概率较低的情况，导致识别率低下。

发明内容

本发明实施例提供了一种语音关键词识别方法、装置、设备及计算机可读存储介质，可以提高识别率。

第一方面，本发明实施例提供了一种语音关键词识别方法，该方法包括：

接收输入的语音信号；

提取所述语音信号中的音频特征；

利用声学模型计算所述音频特征所对应的音素的概率，作为第一概率；

根据所述第一概率，利用发音词典计算音素对应于词的概率，作为第二概率，其中，发音词典包括所有关键词的发音以及垃圾模型的发音，其中，垃圾模型包括所有的单字；

根据所述第二概率，利用语言模型计算词组合成关键词的概率，作为第三概率，其中，语言模型包括所有的关键词以及垃圾模型；

判断所述第三概率是否大于阈值；

若所述第三概率大于阈值，统计所述第三概率对应的关键词的数量；

若所述第三概率对应的关键词的数量为一个，将所述第三概率对应的关键词作为关键词识别的结果。

第二方面，本发明实施例提供了一种语音关键词识别装置，该装置包括用于执行上述第一方面所述的语音关键词识别方法的单元。