[发明专利]语音关键词识别方法、装置、设备及计算机可读存储介质有效
| 申请号: | 201710855490.7 | 申请日: | 2017-09-20 |
| 公开(公告)号: | CN107665705B | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 查高密;程宁;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/14;G10L15/22;G10L15/26 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 关键词 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明实施例提供一种语音关键词识别方法、装置、设备及计算机可读存储介质。所述语音关键词识别方法包括:接收输入的语音信号;提取语音信号中的音频特征;根据所述音频特征,利用声学模型、发音词典、语言模型计算关键词对于声学模型、发音词典、语言模型的概率;判断所述概率是否大于阈值,若所述概率大于阈值,统计所述概率对应的关键词的数量;若所述概率对应的关键词的数量为一个,将所述概率对应的关键词作为关键词识别的结果。本发明实施例当计算出可能的关键词的概率后,将概率中大于阈值的对应的一个关键词作为关键词识别的结果,提高了关键词的识别率。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种语音关键词识别方法、装置、设备及计算机可读存储介质。
背景技术
一个通用的大词汇量连续语音识别系统(Large Vocabulary Continuous SpeechRecognition,LVCSR)进行语音关键词识别的过程是:先对语音进行识别,获得一个或多个可能的语句文本,然后在文本中搜索关键词。如果关键词在某个文本中出现,则认为语句中有关键词。一个通用的LVCSR系统使用的语言模型会试图捕捉自然语言的特点如自然语言中上下文之间的关系,从而识别出语言中较有可能出现的句子。在关键词识别的任务中,常常因为有多种可能的发音相近的语句,导致即使语句中出现了关键词,最有可能的一个或多个识别结果中也不包括关键词(因为它考虑了语言中上下文之间的关系),尤其是关键词本身在语言中出现的概率较低的情况,导致识别率低下。
发明内容
本发明实施例提供了一种语音关键词识别方法、装置、设备及计算机可读存储介质,可以提高识别率。
第一方面,本发明实施例提供了一种语音关键词识别方法,该方法包括:
接收输入的语音信号;
提取所述语音信号中的音频特征;
利用声学模型计算所述音频特征所对应的音素的概率,作为第一概率;
根据所述第一概率,利用发音词典计算音素对应于词的概率,作为第二概率,其中,发音词典包括所有关键词的发音以及垃圾模型的发音,其中,垃圾模型包括所有的单字;
根据所述第二概率,利用语言模型计算词组合成关键词的概率,作为第三概率,其中,语言模型包括所有的关键词以及垃圾模型;
判断所述第三概率是否大于阈值;
若所述第三概率大于阈值,统计所述第三概率对应的关键词的数量;
若所述第三概率对应的关键词的数量为一个,将所述第三概率对应的关键词作为关键词识别的结果。
第二方面,本发明实施例提供了一种语音关键词识别装置,该装置包括用于执行上述第一方面所述的语音关键词识别方法的单元。
第三方面,本发明实施例还提供了一种设备,所述设备包括存储器,以及与所述存储器相连的处理器;
所述存储器用于存储实现语音关键词识别的程序数据,所述处理器用于运行所述存储器中存储的程序数据,以执行上述第一方面所述的语音关键词识别方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序数据,所述一个或者一个以上程序数据可被一个或者一个以上的处理器执行,以实现上述第一方面所述的语音关键词识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710855490.7/2.html,转载请声明来源钻瓜专利网。





