[发明专利]一种语音文本的纠错方法及装置有效
申请号: | 202110206015.3 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113012705B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 刘璐 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L15/02;G10L15/08;G10L15/22;G10L15/26;G06F40/253;G06F40/284;G06F40/30 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 郭放;许伟群 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 文本 纠错 方法 装置 | ||
1.一种语音文本的纠错方法,其特征在于,包括:
从用户输入的语音数据中提取语音文本,利用词语检错器检测所述语音文本中是否存在异常单元,在所述语音文本中存在异常单元时,从纠错词基准库中选出与所述异常单元编辑距离小于编辑距离阈值的候选纠错词,以及将所述异常单元替换为所述候选纠错词,其中,所述词语检错器为基于N-Gram算法创建的;所述候选纠错词中的每个字与所述异常单元中对应的每个字的编辑距离均小于所述编辑距离阈值;所述语音文本为中文时,所述编辑距离的计算步骤为:将待计算编辑距离的两个字的拼音音节中的声母、韵母以及声调的三种维度分别比较,计算三种维度的编辑距离,以及将三种维度的编辑距离求和,得到待计算编辑距离的两个字的编辑距离;中文的拼音音节由声母、韵母以及声调三要素组成,所述声母和所述韵母为独立的英文字符串,使用字符串的编辑距离方式获取声母和韵母的编辑距离;两个字拼音音节对比时,声母、韵母、音调三个维度变化对拼音相似度影响不同,当三个维度中两个及以上同时变化时,拼音相似度差异增加;在计算总编辑距离时,增加正惩罚机制,通过设置正惩值,选择所述编辑距离阈值;
在所述语音文本中不存在异常单元时,确定所述语音文本正确。
2.根据权利要求1所述的语音文本的纠错方法,其特征在于,所述词语检错器可框选所述语音文本中的N个字,所述利用词语检错器判断所述语音文本中是否存在异常单元的具体步骤为:
将所述词语检错器放置在所述语音文本上滑动,在所述词语检错器内的N个字同时出现的条件概率大于等于经验概率阈值时,确定所述词语检错器内的N个字不为异常单元;
在所述词语检错器内的N个字同时出现的条件概率小于所述经验概率阈值时,确定所述词语检错器内的N个字为异常单元。
3.根据权利要求1所述的语音文本的纠错方法,其特征在于,在将所述异常单元替换为所述候选纠错词之后,所述方法还包括:
利用概率上下文无关文法对纠错后的所述语音文本进行校验。
4.根据权利要求3所述的语音文本的纠错方法,其特征在于,所述利用概率上下文无关文法对纠错后的所述语音文本进行校验的具体步骤为:
按照训练好的语法树模型对纠错后的所述语音文本执行生成语法树处理,在纠错后的所述语音文本可按照训练好的语法树模型生成完整的语法树时,确定纠错后的所述语音文本正确;
在纠错后的所述语音文本不可按照训练好的语法树模型生成完整的语法树时,确定纠错后的所述语音文本不正确。
5.根据权利要求4所述的语音文本的纠错方法,其特征在于,从纠错词基准库中选出的与所述异常单元编辑距离小于编辑距离阈值的候选纠错词为多个,将所述异常单元分别替换为多个所述候选纠错词,得到多个纠错后的所述语音文本;
在多个纠错后的所述语音文本均可按照训练好的语法树模型生成完整的语法树时,计算多个生成的语法树的概率,将概率最高的语法树对应的所述语音文本确定为最终纠错后的所述语音文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110206015.3/1.html,转载请声明来源钻瓜专利网。