[发明专利]语音识别结果的校正方法及装置、电子设备、存储介质在审
申请号: | 202011566768.7 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112669845A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 简仁贤;陈映文;张嘉恬;林长洲 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L25/51;G10L15/02 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 结果 校正 方法 装置 电子设备 存储 介质 | ||
本申请提供一种语音识别结果的校正方法及装置、电子设备、存储介质,该方法包括:获取同一语音输入的多种候选词序列;针对每种候选词序列,利用已训练的与目标场景对应的个性化模型,计算候选词序列中每个词汇的出现概率;根据每种候选词序列中每个词汇的出现概率,选取最佳词序列;计算最佳词序列中每个词汇与目标场景对应的关键词之间的音素相似度;根据关键词对应配置的阈值,用关键词替换最佳词序列中与关键词之间的音素相似度大于阈值的词汇。该方案可以提高语音识别结果的准确性。
技术领域
本申请涉及语音识别技术领域,特别涉及一种语音识别结果的校正方法及装置、电子设备、存储介质。
背景技术
随着科技的发展,人类已进入人工智能时代,人工智能用于延展人类的智慧和能力,模拟人类的思维过程和智能行为,使机器能够胜任通常需要人类智能才能完成的复杂工作。人工智能的其中一个重要分支包括语音识别,语音识别技术是机器通过识别和理解过程把输入的语音信号转变成相应的文本,实现人与机器的交流。
目前,部分公司研制出的语音识别技术是基于具有庞大的云数据处理能力的大数据平台计算而来,数据量具有大而广的特点,可以基本实现人机语言交互,但是,在语音识别系统中,时常出现以下情况,例如,接收到用户的语音“lihua”,通过初始识别获取的对应文本为“李华”,可能校正为“梨花”、“理化”或者“礼花”多种文本,导致校正正确率低下,或是矫枉过正。
发明内容
本申请实施例提供了语音识别结果的校正方法,用以提高语音识别结果的准确度。
本申请实施例提供了一种语音识别结果的校正方法,包括:
获取同一语音输入的多种候选词序列;
针对每种候选词序列,利用已训练的与目标场景对应的个性化模型,计算所述候选词序列中每个词汇的出现概率;
根据每种候选词序列中每个词汇的出现概率,选取最佳词序列;
计算所述最佳词序列中每个词汇与所述目标场景对应的关键词之间的音素相似度;
根据所述关键词对应配置的阈值,用所述关键词替换所述最佳词序列中与所述关键词之间的音素相似度大于阈值的词汇。
在一实施例中,在所述针对每种候选词序列,利用已训练的与目标场景对应的个性化模型,计算所述候选词序列中每个词汇的出现概率之前,所述方法还包括:
获取所述目标场景对应的文本语料、关键词以及每个关键词对应的权重;
通过N元语言模型的统计方法统计所述文本语料中每个词汇的出现概率,得到文本语言模型;
将已有语言模型与所述文本语言模型通过插补法融合得到文本模型;
根据每个关键词的权重,增加所述文本模型中关键词对应的概率,得到所述个性化模型。
在一实施例中,所述将已有语言模型与所述文本语言模型通过插补法融合得到文本模型,包括:
针对所述文本语料中的每个词汇,根据所述词汇在所述已有语言模型中的概率值以及在所述文本语言模型中的概率值,加权相加得到所述词汇在所述文本模型中的概率值。
在一实施例中,所述根据每个关键词的权重,增加所述文本模型中关键词对应的概率,得到所述个性化模型,包括:
针对任一所述关键词,若所述关键词存在于所述已有语言模型,根据所述关键词在所述已有语言模型中的旧概率值以及所述关键词的权重和长度,计算所述关键词在所述个性化模型中的新概率值。
在一实施例中,所述根据每个关键词的权重,增加所述文本模型中关键词对应的概率,得到所述个性化模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011566768.7/2.html,转载请声明来源钻瓜专利网。