[发明专利]一种基于AC自动机热词增强的语音识别方法和系统在审
| 申请号: | 202210103668.3 | 申请日: | 2022-01-28 |
| 公开(公告)号: | CN114187902A | 公开(公告)日: | 2022-03-15 |
| 发明(设计)人: | 李立峰 | 申请(专利权)人: | 杭州一知智能科技有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/183;G06F40/279;G06F40/242;G06F16/33 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
| 地址: | 311200 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ac 自动机 增强 语音 识别 方法 系统 | ||
本发明提出了一种基于AC自动机热词增强的语音识别方法和系统,属于语音识别技术领域。分别构建以字和词为单元的语言模型,用于生成解码图;获取热词表,以语言模型中的字和词作为字典,对热词表中的每一个热词进行分词,构建AC自动机;在语音识别的解码路径搜索过程中构建令牌结构体,用于存储解码图上的当前解码路径的所有结点指针和总代价、AC自动机上的当前匹配路径的结点指针和该结点的缩小代价值;令牌结构体随着解码图中当前时刻解码的结点进行传递;将解码图中当前结点输出的识别结果与AC自动机动态匹配,在动态匹配过程中建立缓存机制,根据匹配结果更新总代价值,最终代价最小的路径为目标路径,输出语音识别结果。
技术领域
本发明涉及语音识别技术领域,具体涉及一种基于AC自动机热词增强的语音识别方法和系统。
背景技术
语音识别技术在生产环境中经常被应用于各个特定领域。每个领域都有其特定的专有名词,通用场景的语音识别系统很难准确识别这些专有名词。热词增强是指根据用户提供的专有名词热词,提升语音识别结果中热词的识别率。
现有技术中,传统语音识别系统解决热词识别的方式主要是采用将热词融合到语言模型中的方式,这种方式无法对热词表进行修改,一旦修改,就需要重新构建设置训练语言模型;另一种方式是将识别结果与热词表中的热词一一进行匹配的方式,匹配时间长,效率低,且热词增多会成倍增加识别速度,热词增强的效果非常有限。
发明内容
为了解决上述技术问题,本发明提出了一种基于AC自动机热词增强的语音识别方法和系统,使用AC自动机结构存储热词表,AC自动机中的字典树结构能很好地与解码过程中的路径搜索方法相适应,方便对热词表进行调整,热词识别精度高,识别速度快。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个目的在于提供一种基于AC自动机热词增强的语音识别方法,包括以下步骤:
步骤1:分别构建以字和词为单元的语言模型,将待识别语音作为语音识别系统的输入,由语言模型生成解码图;
步骤2:获取热词表,以语言模型中的字和词作为字典,对热词表中的每一个热词进行分词,构建基于热词的AC自动机;
步骤3:在语音识别的解码路径搜索过程中建立令牌结构体,用于存储解码图上的当前解码路径的所有结点指针和总代价、AC自动机上的当前匹配路径的结点指针和该结点的缩小代价值;令牌结构体随着解码图中当前时刻解码的结点进行传递;
将解码图中当前结点输出的识别结果与基于热词的AC自动机动态匹配,若匹配成功,则对解码图中当前解码路径的总代价进行更新,使更新后的总代价降低;若匹配失败,则解码图中当前解码路径的总代价不变;
解码图中的不同解码路径形成竞争机制,最终代价最小的路径为目标路径,输出语音识别结果。
本发明的第二个目的在于提供一种基于AC自动机热词增强的语音识别系统,包括:
语言模型模块,其融合有以字为单元的语言模型和以词为单位的语言模型;
解码图生成模块,其用于生成待识别语音对应的解码图;
AC自动机构建模块,其用于获取热词表,以语言模型模块中的字和词作为字典,对热词表中的每一个热词进行分词,得到基于热词的AC自动机;
令牌结构体模块,其用于存储解码图上的当前解码路径的所有结点指针和总代价、以及AC自动机上的当前匹配路径的结点指针和该结点的缩小代价值;
解码图搜索模块,其用于将解码图中当前结点输出的识别结果与基于热词的AC自动机动态匹配,若匹配成功,则对解码图中当前解码路径的总代价进行更新,使更新后的总代价降低;若匹配失败,则解码图中当前解码路径的总代价不变;
语音识别输出模块,其用于将解码图搜索模块中代价最小的路径作为目标路径,输出目标路径对应的语音识别结果。
与现有技术相比,本发明的优势在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210103668.3/2.html,转载请声明来源钻瓜专利网。





