[发明专利]语音识别结果的校正方法及装置、电子设备、存储介质在审

申请号：	202011566768.7	申请日：	2020-12-25
公开（公告）号：	CN112669845A	公开（公告）日：	2021-04-16
发明（设计）人：	简仁贤;陈映文;张嘉恬;林长洲	申请（专利权）人：	竹间智能科技（上海）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L25/51;G10L15/02
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	钟扬飞
地址：	200030 上海市徐***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别结果校正方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种语音识别结果的校正方法及装置、电子设备、存储介质，该方法包括：获取同一语音输入的多种候选词序列；针对每种候选词序列，利用已训练的与目标场景对应的个性化模型，计算候选词序列中每个词汇的出现概率；根据每种候选词序列中每个词汇的出现概率，选取最佳词序列；计算最佳词序列中每个词汇与目标场景对应的关键词之间的音素相似度；根据关键词对应配置的阈值，用关键词替换最佳词序列中与关键词之间的音素相似度大于阈值的词汇。该方案可以提高语音识别结果的准确性。

技术领域

本申请涉及语音识别技术领域，特别涉及一种语音识别结果的校正方法及装置、电子设备、存储介质。

背景技术

随着科技的发展，人类已进入人工智能时代，人工智能用于延展人类的智慧和能力，模拟人类的思维过程和智能行为，使机器能够胜任通常需要人类智能才能完成的复杂工作。人工智能的其中一个重要分支包括语音识别，语音识别技术是机器通过识别和理解过程把输入的语音信号转变成相应的文本，实现人与机器的交流。

目前，部分公司研制出的语音识别技术是基于具有庞大的云数据处理能力的大数据平台计算而来，数据量具有大而广的特点，可以基本实现人机语言交互，但是，在语音识别系统中，时常出现以下情况，例如，接收到用户的语音“lihua”，通过初始识别获取的对应文本为“李华”，可能校正为“梨花”、“理化”或者“礼花”多种文本，导致校正正确率低下，或是矫枉过正。

发明内容

本申请实施例提供了语音识别结果的校正方法，用以提高语音识别结果的准确度。

本申请实施例提供了一种语音识别结果的校正方法，包括：

获取同一语音输入的多种候选词序列；

针对每种候选词序列，利用已训练的与目标场景对应的个性化模型，计算所述候选词序列中每个词汇的出现概率；

根据每种候选词序列中每个词汇的出现概率，选取最佳词序列；

计算所述最佳词序列中每个词汇与所述目标场景对应的关键词之间的音素相似度；

根据所述关键词对应配置的阈值，用所述关键词替换所述最佳词序列中与所述关键词之间的音素相似度大于阈值的词汇。

在一实施例中，在所述针对每种候选词序列，利用已训练的与目标场景对应的个性化模型，计算所述候选词序列中每个词汇的出现概率之前，所述方法还包括：

获取所述目标场景对应的文本语料、关键词以及每个关键词对应的权重；

通过N元语言模型的统计方法统计所述文本语料中每个词汇的出现概率，得到文本语言模型；

将已有语言模型与所述文本语言模型通过插补法融合得到文本模型；