[发明专利]语音识别方法及其装置在审

专利信息
申请号: 202011295150.1 申请日: 2020-11-18
公开(公告)号: CN112489646A 公开(公告)日: 2021-03-12
发明(设计)人: 沈来信;朱相宇;王映新;孙明东;贾师惠 申请(专利权)人: 北京华宇信息技术有限公司
主分类号: G10L15/22 分类号: G10L15/22;G10L15/06;G10L15/08;G10L25/12
代理公司: 北京中索知识产权代理有限公司 11640 代理人: 胡大成
地址: 100084 北京市海淀区中关村*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 及其 装置
【说明书】:

本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。

技术领域

发明涉及语音识别领域,尤其涉及一种语音识别方法及其装置。

背景技术

语音识别的解码与应用场景相关性很大,用户总是期望语音识别模型能够向用户的场景语料进行一定指向性的解码识别。目前,基于用户热词进行语音识别,在上传热词时,要通过人工定义热词并设置其权重值。若这些权重值的设置相差较大,则会导致语音识别结果严重偏离正常语境,且热词上传的数量也有限制,用户对热词进行选择时存在一定的困难。

发明内容

本申请实施例提供一种语音识别方法,用以解决现有技术中语音识别结果偏离正常语境的问题。具体包括:

获取输入的语音数据;

通过解码模型解码所述语音数据,生成语音识别中间结果;

基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;

根据所述拼音与声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。

进一步的,在本申请提供的一种优选实施方式中,所述解码模型由声学模型、字典和语言模型共同构成。

进一步的,在本申请提供的一种优选实施方式中,所述语言模型为基于文本预处理语料,对前景语言模型与背景语言模型进行插值拟合生成的新的语言模型;

其中,前景语言模型为用户语言模型,权重值预设为0.5-0.8,该前景语言模型包含用户指定场景语料;背景语言模型为原有语音识别引擎的语言模型,该背景语言模型包含各场景语料。

进一步的,在本申请提供的一种优选实施方式中,对新生成的语言模型要进行平滑和剪枝操作;

其中,剪枝操作基于前景语言模型,对背景语言模型进行无关场景语料删除,且应保留前景语言的分支;平滑操作基于新生成的语言模型,重新分布该语言模型中所有场景语料的条件概率,且平滑操作后所有场景语料条件概率和为1。

进一步的,在本申请提供的一种优选实施方式中,所述核心词数据库基于文本预处理语料进行分词及统计词频,并根据词频生成对应分词权重而建立;

其中,对应分词权重通过每个词的词频除以最大词频与一个常量的和的方式来计算,所述常量取所有词频的中值。

进一步的,在本申请提供的一种优选实施方式中,所述核心词数据库可根据用户上传的核心词信息进行匹配,并自动推荐对应权重值,且用户可根据实际需求调整该权重值,以增加语音识别的准确性;

其中,经检索如未发现用户核心词,则将当前核心词数据库中的所有词的权重中值作为推荐值。

进一步的,在本申请提供的一种优选实施方式中,所述匹配结果为语音识别中间结果在数据库中存在对应的拼音与语调序列时,则对该拼音与语调序列进行核心词替换。

进一步的,在本申请提供的一种优选实施方式中,所述核心词进行替换时,若包含替换序列的句子的语言模型混淆度相比于原有句子降低一个阈值,则可完成核心词序列替换,并输出包含替换序列的语音识别中间结果;

其中,降低的一个阈值,可以根据实际环境进行调整。

进一步的,在本申请提供的一种优选实施方式中,在执行所述包含替换序列的句子作为语音识别结果输出的步骤之前,还包括对该包含替换序列的句子进行断句及标点预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇信息技术有限公司,未经北京华宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011295150.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top