[发明专利]一种提高语音识别准确率的方法及系统有效
申请号: | 201210584660.X | 申请日: | 2012-12-28 |
公开(公告)号: | CN103903619A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 潘青华;何婷婷;余健;鹿晓亮;王智国;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/26 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;赵镇勇 |
地址: | 230088 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 语音 识别 准确率 方法 系统 | ||
技术领域
本发明涉及语音信号处理领域,尤其涉及一种提高语音识别准确率的方法及系统。
背景技术
随着手机等智能终端上语音输入功能和应用的普及,用户在手机等智能终端上使用语音输入的需求越来越多,对用户个性化信息,尤其是通讯录中联系人的识别准确率也提出了更高的要求。而传统连续语音识别系统由于语言模型训练方式及识别方法的局限性,对存在多音字现象的汉语语音信号可能无法提供正确的字词结果,特别是在人名信息识别中,其识别准确率更受到了进一步的限制:首先,中文常见人名数量众多,对此连续语音识别的词典中通常将人名字词作为未登录词处理,导致训练语料中覆盖的人名数量极其有限;其次,中文人名同音字大量存在,常见人名有几十个甚至更多的汉字组合;再次,对每个用户来说,用户特有的个性化通讯录中联系人人名可能还会有一部分非常用人名,即每个个性化的人名列表在训练语料中无法均匀覆盖。基于以上原因,用于连续语音识别的语言模型不能很好的模拟人名字词特别是用户个性化联系人名字词,人名识别效果也往往明显低于其他内容的识别效果,在应用连续语音识别的语音输入法等应用中个性化人名的识别效果成为影响用户体验的重要瓶颈。
现有技术中,在连续语音识别系统中通过热词激励的方法提高用户预置热词所在解码路径概率,以提高该路径的存活率,获取热词的识别结果。具体过程为:语音识别系统首先计算接收到的每帧语音信号到达搜索网络中每个活跃节点的累积历史路径概率(包括声学模型概率和语言模型概率);然后判断所述当前历史路径是否包括有热词词条或词条部分,若是则按照系统预设激励方案更新路径的累积历史概率,对路径得分采取固定激励加分的方法以提高热词所在路径的优先级;再将每条满足系统预设条件的路径向后扩展获取新的活跃节点;当对最后一帧音解码后通过路径回溯选择具有最大累积概率的历史路径即为解码结果。
然而,即使现有技术中通过提高热词所在路径的概率提高了热词的识别率,但依然无法解决连续语音信号的整体识别率。如图1所示,当用户语音输入“这是陈旭原来住的房间”时,传统语音识别系统在基于通用语言模型及声学模型的搜索网络中可能将其识别为更普适的“这是程序员楼主的房间”。而在基于热词激励的语音识别系统中,由于提高了“陈旭”热词词条所在的解码路径的概率,其识别结果将变更为“这是陈旭原楼主的房间”。由此可见,热词激励方法只是提高了热词节点的累积历史概率,提高了热词节点和同时刻其他活跃节点的区分度,而对由热词扩展出的路径的概率没有提升,即无法修正热词相关的上下文内容识别错误的问题,因而导致人名上下文的识别错误依然无法修正。
发明内容
本发明的目的是提供一种提高语音识别准确率的方法及系统,基于用户预置信息进行数据匹配与校正,提高了语音信息识别的准确率。
一种提高语音识别准确率的方法,包括:
根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;
通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正;
根据校正后的候选字词的语言模型概率进行语音解码处理。
一种提高语音识别准确率的系统,该系统包括:
匹配模块,用于根据用户预置信息对通过第一次解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;
校正模块,用于通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正。
解码模块,用于根据校正后的候选字词的语言模型概率进行语音解码处理。
由上述本发明提供的技术方案可以看出,根据用户预置信息对语音解码获得的路径进行优化处理,以及对路径中候选字词的语言模型概率进行校正,提高了对用户特定信息及该信息上下文内容的识别准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为现有技术中一种语音识别的示意图;
图2为本发明实施例一提供的一种提高语音识别准确率的方法的流程图;
图3为本发明实施例二提供的又一种提高语音识别准确率的方法的流程图;
图4为本发明实施例二提供的第一次解码的示意图;
图5为本发明实施例二提供的第二次解码的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210584660.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种永磁偏置混合径向磁轴承
- 下一篇:一种高度集成的医用吊塔转轴结构