[发明专利]一种语音识别的方法和装置有效

申请号：	201611219528.3	申请日：	2016-12-26
公开（公告）号：	CN106847266B	公开（公告）日：	2019-12-13
发明（设计）人：	王东;马习;张之勇;张雪薇;张玥	申请（专利权）人：	清华大学
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/08;G10L15/183;G10L25/51
代理公司：	11319 北京润泽恒知识产权代理有限公司	代理人：	苏培华
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种语音识别的方法和装置，包括：将语言模型表示为有限状态转移机；待识别的新词根据设定规则在所述有限状态转移机获得所述新词对应的近义词；将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别，从而解决了目前语音识别中新词快速添加和识别的问题。

技术领域

本申请涉及信息技术领域，特别是涉及一种语音识别的方法和装置。

背景技术

近年来，语音识别技术成为了信息技术领域中的重要的发展技术之一。语音识别技术使人们能够甩掉键盘，通过语音命令进行操作，使语音识别技术在众多领域得到广泛应用。

语音识别技术是将声音转变成文本的技术。目前采用语音模型和语言模型结合的方式，实现对语音的识别，其中，语音模型用来描述语音信号的分布特性，而语言模型用于识别语音信号对应的词序列，用以限制系统能识别的句子范围，语言模型基于一个系统词表，只有在词表中出现的词才有可能被识别出来。

随着信息社会的快速发展，新生的词汇不断涌现，例如：颜值、吐槽、洪荒之力等等，由于新的词汇不在语音识别的系统词表中，因此很难被识别出来。

发明内容

本申请实施例提供了一种语音识别的方法和装置，以解决目前无法识别新词和新词快速添加的问题。

为了解决上述问题，本申请公开了一种语音识别的方法，包括：

将语言模型表示为有限状态转移机；

待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词；

将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别。