[发明专利]连续语音识别方法、装置、设备和存储介质有效
| 申请号: | 201810712975.5 | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN108735201B | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 李忠杰 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
| 主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/08;G10L15/02 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 510530 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 连续 语音 识别 方法 装置 设备 存储 介质 | ||
1.一种连续语音识别方法,其特征在于,包括:
将待识别连续语音的当前帧进行预处理得到语音转换数据;
根据所述语音转换数据在连续语音识别结构中进行前向搜索,生成当前帧的状态节点路径信息,其中,所述连续语音识别结构包括加权有限状态转换器WFST和语义结束状态节点;所述加权有限状态转换器WFST中的第一状态节点与所述语义结束状态节点之间设置有前向边;所述第一状态节点为所述加权有限状态转换器WFST中语义结束概率不为0的状态节点;所述前向边的权重值等于所述加权有限状态转换器WFST结构中状态节点对应的所述语义结束概率;所述状态节点路径信息包括当前帧的状态节点、搜索路径和路径累积代价;
若所述状态节点路径信息中包括语义结束状态节点,则将所述状态节点路径信息中所述语义结束状态节点对应的搜索路径按照路径累积代价进行排序;
根据所述按照路径累积代价进行排序的结果,取出所述路径累积代价最小的搜索路径作为最佳搜索路径,并输出所述最佳搜索路径的搜索结果。
2.根据权利要求1所述的连续语音识别方法,其特征在于,所述根据所述语音转换数据在连续语音识别结构中进行前向搜索,生成当前帧的状态节点路径信息,包括:
根据所述语音转换数据在所述连续语音识别结构中进行前向搜索,得到至少一个状态节点以及每个所述状态节点对应的搜索路径;
根据各所述搜索路径计算各所述状态节点对应的路径累积代价;
整合所述状态节点、所述状态节点对应的搜索路径和所述路径累积代价生成所述当前帧的状态节点路径信息。
3.根据权利要求2所述的连续语音识别方法,其特征在于,所述根据各所述搜索路径计算各所述状态节点对应的路径累积代价,包括:
累计各所述搜索路径经过的所述连续语音识别结构前向边上权重,并结合声学模型代价计算各所述状态节点对应的路径累积代价。
4.根据权利要求1所述的连续语音识别方法,其特征在于,在根据所述语音转换数据在连续语音识别结构中进行前向搜索,生成当前帧的状态节点路径信息之后,还包括:
若所述当前帧的状态节点路径信息中不包括语义结束状态节点,且当前帧不为所述待识别连续语音的最后一帧,则将所述待识别连续语音的下一帧作为当前帧,并继续前向搜索。
5.一种连续语音识别方法,其特征在于,包括:
将待识别连续语音的当前帧进行预处理得到语音转换数据;
根据所述语音转换数据在连续语音识别结构中进行前向搜索,生成当前帧的状态节点路径信息,其中,所述连续语音识别结构包括加权有限状态转换器WFST和语义结束状态节点;所述加权有限状态转换器WFST中的第一状态节点与所述语义结束状态节点之间设置有前向边;所述第一状态节点为所述加权有限状态转换器WFST中语义结束概率不为0的状态节点;所述前向边的权重值等于所述加权有限状态转换器WFST结构中状态节点对应的所述语义结束概率;所述状态节点路径信息包括当前帧的状态节点、搜索路径和路径累积代价;
若所述状态节点路径信息中包括语义结束状态节点,则将所述状态节点路径信息中所述语义结束状态节点对应的状态节点路径信息保存到语义结束状态节点路径信息;
获取所述语义结束状态节点路径信息中的所有所述状态节点路径信息;
从所述语义结束状态节点回溯取出路径累积代价最小的搜索路径作为最佳搜索路径,并输出所述最佳搜索路径的搜索结果。
6.根据权利要求5所述的连续语音识别方法,其特征在于,所述根据所述语音转换数据在连续语音识别结构中进行前向搜索,生成当前帧的状态节点路径信息,包括:
根据所述语音转换数据在所述连续语音识别结构中进行前向搜索,得到至少一个状态节点以及每个所述状态节点对应的搜索路径;
根据各所述搜索路径计算各所述状态节点对应的路径累积代价;
整合所述状态节点、所述状态节点对应的搜索路径和所述路径累积代价生成所述当前帧的状态节点路径信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810712975.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种说话人自动标注方法
- 下一篇:用于小占用资源关键词检索的卷积递归神经网络





