[发明专利]语音搜索优化方法、装置和系统有效

申请号：	201810501682.2	申请日：	2018-05-23
公开（公告）号：	CN108694939B	公开（公告）日：	2020-11-03
发明（设计）人：	李忠杰	申请（专利权）人：	广州视源电子科技股份有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/02;G10L15/26
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	刘艳丽
地址：	510530 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音搜索优化方法装置系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种语音搜索优化方法,包括步骤：获取输入信号，并将输入信号与预置模板进行匹配分析；若存在与输入信号匹配的预置模板，则重置WFST网络的搜索状态；根据重置搜索状态后的WFST网络，对与输入信号匹配的预置模板进行前置搜索，获得与预置模板相对应的优化WFST网络；根据优化WFST网络，完成各帧的语音信号的搜索，得到搜索结果。还公开一种语音搜索系统。通过在输入信号与预置模板相匹配时，重置WFST网络的搜索状态，进而根据预置模板在重置搜索状态后的WFST网络中进行前置搜索，得到并根据优化WFST网络对各帧的语音信号进行搜索，输出搜索结果。解决了传统的语音识别方式仍然存在识别准确率不高的问题，达到了大幅提升语音识别准确率的效果。

技术领域

本发明涉及语音识别技术领域，特别是涉及一种语音搜索优化方法、装置和语音搜索系统。

背景技术

随着信息技术的不断革新，各种智能设备也在快速更新换代。作为众多智能设备的热门技术之一的语音识别技术，即是一种数据信息应用的典型代表。语音识别技术能够将给定的语音识别成对应的文字信息，因此，被广泛应用在各种智能交互设备上，例如智能交互设备的语音唤醒功能和语音助手等功能。

传统的语音识别方式，一般是将输入的语音信号按帧提取特征，并根据声学模型计算出相应分类的概率，搜索部分从WFST网络的开始节点，根据每帧的分类概率，逐帧搜索遍历直至完成全部语音输入帧的搜索，根据所得到的路径获取最终的识别结果。然而，发明人在实现本发明的过程中，发现传统的语音识别方式仍然存在识别准确率不高的问题。

发明内容

基于此，有必要针对传统的语音识别方式仍然存在识别准确率不高的问题，提供一种语音搜索优化方法，一种语音搜索优化装置以及一种语音搜索系统。

为实现上述目的，本发明实施例采用以下技术方案：

一方面，本发明实施例提供一种语音搜索优化方法，包括步骤：

获取输入信号，并将所述输入信号与预置模板进行匹配分析；

若存在与所述输入信号匹配的所述预置模板，则重置WFST网络的搜索状态；

根据重置搜索状态后的所述WFST网络，对与所述输入信号匹配的所述预置模板进行前置搜索，获得与所述预置模板相对应的优化WFST网络；

根据所述优化WFST网络，完成各帧的语音信号的搜索，得到搜索结果。

在其中一个实施例中，所述输入信号包括所述语音信号；将所述输入信号与预置模板进行匹配分析的过程，包括：

对所述语音信号进行特征提取，得到所述语音信号的声学特征信息；

将所述声学特征信息与所述预置模板的声学特征信息进行匹配。

在其中一个实施例中，将所述输入信号与预置模板进行匹配分析的过程，还包括：