[发明专利]语音搜索优化方法、装置和系统有效
申请号: | 201810501682.2 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108694939B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 李忠杰 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02;G10L15/26 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 刘艳丽 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 搜索 优化 方法 装置 系统 | ||
本发明涉及一种语音搜索优化方法,包括步骤:获取输入信号,并将输入信号与预置模板进行匹配分析;若存在与输入信号匹配的预置模板,则重置WFST网络的搜索状态;根据重置搜索状态后的WFST网络,对与输入信号匹配的预置模板进行前置搜索,获得与预置模板相对应的优化WFST网络;根据优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。还公开一种语音搜索系统。通过在输入信号与预置模板相匹配时,重置WFST网络的搜索状态,进而根据预置模板在重置搜索状态后的WFST网络中进行前置搜索,得到并根据优化WFST网络对各帧的语音信号进行搜索,输出搜索结果。解决了传统的语音识别方式仍然存在识别准确率不高的问题,达到了大幅提升语音识别准确率的效果。
技术领域
本发明涉及语音识别技术领域,特别是涉及一种语音搜索优化方法、装置和语音搜索系统。
背景技术
随着信息技术的不断革新,各种智能设备也在快速更新换代。作为众多智能设备的热门技术之一的语音识别技术,即是一种数据信息应用的典型代表。语音识别技术能够将给定的语音识别成对应的文字信息,因此,被广泛应用在各种智能交互设备上,例如智能交互设备的语音唤醒功能和语音助手等功能。
传统的语音识别方式,一般是将输入的语音信号按帧提取特征,并根据声学模型计算出相应分类的概率,搜索部分从WFST网络的开始节点,根据每帧的分类概率,逐帧搜索遍历直至完成全部语音输入帧的搜索,根据所得到的路径获取最终的识别结果。然而,发明人在实现本发明的过程中,发现传统的语音识别方式仍然存在识别准确率不高的问题。
发明内容
基于此,有必要针对传统的语音识别方式仍然存在识别准确率不高的问题,提供一种语音搜索优化方法,一种语音搜索优化装置以及一种语音搜索系统。
为实现上述目的,本发明实施例采用以下技术方案:
一方面,本发明实施例提供一种语音搜索优化方法,包括步骤:
获取输入信号,并将所述输入信号与预置模板进行匹配分析;
若存在与所述输入信号匹配的所述预置模板,则重置WFST网络的搜索状态;
根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的所述预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;
根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。
在其中一个实施例中,所述输入信号包括所述语音信号;将所述输入信号与预置模板进行匹配分析的过程,包括:
对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;
将所述声学特征信息与所述预置模板的声学特征信息进行匹配。
在其中一个实施例中,将所述输入信号与预置模板进行匹配分析的过程,还包括:
对所述语音信号进行语音识别,得到识别结果;
将所述识别结果与所述预置模板进行匹配。
在其中一个实施例中,若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态的步骤之前,还包括:
获取所述语音信号;
对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;
根据所述声学特征信息,通过预先训练的声学模型对所述语音信号进行分类计算,得到所述语音信号的分类及对应的分类概率;其中,所述分类概率用于所述WFST网络对所述语音信号的搜索。
在其中一个实施例中,所述输入信号还包括所述声学特征信息;将所述输入信号与预置模板进行匹配分析的过程,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810501682.2/2.html,转载请声明来源钻瓜专利网。