[发明专利]一种提高语音识别准确率的方法及系统有效
| 申请号: | 201210584660.X | 申请日: | 2012-12-28 |
| 公开(公告)号: | CN103903619A | 公开(公告)日: | 2014-07-02 |
| 发明(设计)人: | 潘青华;何婷婷;余健;鹿晓亮;王智国;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
| 主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/26 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;赵镇勇 |
| 地址: | 230088 *** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 提高 语音 识别 准确率 方法 系统 | ||
1.一种提高语音识别准确率的方法,其特征在于,包括:
根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;
通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正;
根据校正后的候选字词的语言模型概率进行语音解码处理。
2.根据权利要求2所述的方法,其特征在于,所述根据用户预置信息对通过第一次解码获得的路径集合进行匹配的步骤包括:
将所述用户预置信息与路径集合中所有的候选字词串转化为拼音;
将路径集合中的候选字词的拼音与预置信息中的拼音进行模糊匹配,获得新的路径集合。
3.根据权利要求2所述的方法,其特征在于,所述获得新的路径集合为:
若匹配成功,则在该候选字词对应的起止节点间增加新的路径及该新的路径对应的候选字词。
4.根据权利要求1所述的方法,其特征在于,以所述用户预留信息为元素构建语言模型的步骤包括:
构建与所述用户预留信息的类型相应的语言数据库,并将该用户预留信息加入该语言数据库中;
根据该语言数据库检测语言模型训练语料中与所述预留信息的类型相应的字词;
将检测到的字词分别标注为独立单元,获得更新后的语言模型训练语料;
将该训练语料按照训练算法转换为分类语言模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述新的路径集合中语言模型的概率进行校正包括:
通过所述分类语言模型查询新的路径集合中候选字词的语言模型概率,并根据该结果对其原始的概率进行校正。
6.一种提高语音识别准确率的系统,其特征在于,该系统包括:
匹配模块,用于根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;
校正模块,用于通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正;
解码模块,用于根据校正后的候选字词的语言模型概率进行语音解码处理。
7.根据权利要求6所述的系统,其特征在于,所述匹配模块包括:
转化子模块,用于将所述用户预置信息与路径集合中所有的候选字词串转化为拼音;
模糊匹配子模块,用于将路径集合中的候选字词的拼音串与预置信息中拼音串进行模糊匹配;
构建子模块,用于根据所述模糊匹配子模块的模糊匹配结果获得新的路径集合。
8.根据权利要求7所述的系统,其特征在于,所述构建子模块具体用于若所述模糊匹配子模块执行的模糊匹配成功,则在该候选字词对应的起止节点间增加新的路径及该新的路径对应的候选字词。
9.根据权利要求6所述的系统,其特征在于,该系统包括:
数据库构建模块,用于构建与所述用户预留信息的类型相应的语言数据库,并将该用户预留信息加入该语言数据库中;
检测模块,根据该语言数据库检测语言模型训练语料中与所述预留信息的类型相应的字词;
标注模块,将检测到的字词分别标注为独立单元,获得更新后的语言模型训练语料;
计算模块,将该训练语料按照训练算法转换为分类语言模型,以提供给所述校正模块。
10.根据权利要求6所述的系统,其特征在于,所述校正模块具体包括:
查验子模块,用于通过所述分类语言模型查询新的路径集合中候选字词的语言模型概率,并根据该结果对其原始的概率进行校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210584660.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种永磁偏置混合径向磁轴承
- 下一篇:一种高度集成的医用吊塔转轴结构





