[发明专利]一种语音识别结果纠错方法在审
申请号: | 201710994082.X | 申请日: | 2017-10-23 |
公开(公告)号: | CN107729321A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 叶伟 | 申请(专利权)人: | 上海百芝龙网络科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L15/26 |
代理公司: | 上海伯瑞杰知识产权代理有限公司31227 | 代理人: | 孟旭彤 |
地址: | 200050 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种语音识别结果纠错方法,包括对语音识别结果进行预处理;找出语音识别结果中容易出错的词句,或对文本语义解析重要的待纠正词、字;对待纠正词、字进行注音,包括全拼和各拼音首字母两种拼音方式,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调;根据所述拼音全拼方式,利用编辑距离确算法,确定最优候选文本及次优候选文本;根据所述拼音首字母,利用编辑距离算法,确定最优候选文本及次优候选文本;将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个;分别将准候选文本替换待纠错文本,利用n‑grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果。 | ||
搜索关键词: | 一种 语音 识别 结果 纠错 方法 | ||
【主权项】:
一种语音识别结果纠错方法,其特征在于,包括以下步骤:S11,对语音识别结果进行预处理;S12,找出语音识别结果中容易出错的词句,或对文本语义解析重要的待纠正词、字;S13,对待纠正词、字进行注音,包括全拼和各拼音首字母两种拼音方式,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调;S14,根据所述拼音全拼方式,利用编辑距离确算法,确定最优候选文本及次优候选文本;S15,根据所述拼音首字母,再次利用编辑距离算法,确定最优候选文本及次优候选文本;S16,将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个;S17,分别将准候选文本替换待纠错文本,利用n‑grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海百芝龙网络科技有限公司,未经上海百芝龙网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710994082.X/,转载请声明来源钻瓜专利网。