[发明专利]基于置信度的语音识别实现方法及系统有效
申请号: | 201710060942.2 | 申请日: | 2017-01-25 |
公开(公告)号: | CN106782513B | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 俞凯;陈哲怀 | 申请(专利权)人: | 上海交通大学;苏州思必驰信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/20;G10L15/30;G10L15/32 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 置信 语音 识别 实现 方法 系统 | ||
一种基于置信度的语音识别实现方法及系统,根据从用户语音进行音素同步解码的语音识别得到解码信息生成音素同步的词图声学信息结构,并基于词图声学信息结构生成混淆网络从而构建语音识别候选结果之间的竞争关系,即混淆网络竞争概率;同时使用基于语言模型的辅助搜索网络构建语音识别的全搜索空间,计算得到完整无损失的全搜索空间概率,并结合音素同步解码的语音识别,对生成的全搜索空间进行搜索过程记录,并由整个搜索历史进行路径回溯,从而得到全搜索空间概率;最后通过对混淆网络竞争概率和全搜索空间概率进行融合得到语音识别的判决结果。本发明一方面可以对语音识别的结果给出正确的置信度,从而改善语音识别用户体验,另一方面可以显著减少语音识别置信度算法的计算和内存资源消耗。
技术领域
本发明涉及的是一种应用于语音识别(Speech Recognition)的准确、高效的置信度(Confidence Measure,CM)技术,具体是一种基于音素同步解码(Phone SynchronousDecoding),词图和混淆网络(Lattice and Confusion Network),辅助搜索空间(Auxiliary Search Space)的语音识别实现方法及系统。
背景技术
语音识别是一种让机器通过识别和理解过程把语音信号转变为相应的文本或命令的人工智能技术。现有语音识别技术仍无法做到完全正确,置信度是一种用于评判语音识别系统自身语音识别结果可靠性的技术,一般以识别结果可靠度或识别结果概率值给出。
传统语音识别置信度技术主要包括基于预测特征的置信度(Predictor featuresbased CM)和基于后验概率的置信度(Posterior based CM),其缺点包括:多预测特征之间往往在统计意义上不互相独立;结合多种预测特征需要额外的模型训练环节,不利于多场景应用;语音识别系统旨在得到正确的文本,而难以给出准确的后验概率,其具体体现在:基于填充物的后验概率方法既不准确同时需要额外的模型训练环节;而基于词图的后验概率方法则对搜索空间建构不全。
发明内容
本发明针对现有技术对解码空间的竞争结果表征不完整,导致得到的置信度不准确;依赖于对语音识别各模型进行重训练,增加大量额外处理;构建解码空间的过程计算量大,导致语音识别耗时增加,不利于改善用户体验等等缺陷,提出一种基于置信度的语音识别实现方法及系统,一方面可以对语音识别的结果给出正确的置信度,从而改善语音识别用户体验,另一方面可以显著减少语音识别置信度算法的计算和内存资源消耗。
本发明是通过以下技术方案实现的:
本发明涉及一种基于置信度的语音识别实现方法,根据从用户语音进行音素同步解码的语音识别得到解码信息生成音素同步的词图声学信息结构,并基于词图声学信息结构生成混淆网络从而构建语音识别候选结果之间的竞争关系,即混淆网络竞争概率;同时使用基于语言模型的辅助搜索网络构建语音识别的全搜索空间,计算得到完整无损失的全搜索空间概率,并结合音素同步解码的语音识别,对生成的全搜索空间进行搜索过程记录,并由整个搜索历史进行路径回溯,从而得到全搜索空间概率;最后通过对混淆网络竞争概率和全搜索空间概率进行融合得到语音识别的判决结果。
技术效果
与现有技术相比,本发明提出的基于音素同步解码(Phone SynchronousDecoding),词图和混淆网络(Lattice and Confusion Network),辅助搜索空间(Auxiliary Search Space)的语音识别置信度技术,相比较传统方法主要有以下不同:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;苏州思必驰信息科技有限公司,未经上海交通大学;苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710060942.2/2.html,转载请声明来源钻瓜专利网。