[发明专利]一种语音识别的方法和装置有效
申请号: | 201611219528.3 | 申请日: | 2016-12-26 |
公开(公告)号: | CN106847266B | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 王东;马习;张之勇;张雪薇;张玥 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/183;G10L25/51 |
代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 苏培华 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
本申请提供了一种语音识别的方法和装置,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别,从而解决了目前语音识别中新词快速添加和识别的问题。
技术领域
本申请涉及信息技术领域,特别是涉及一种语音识别的方法和装置。
背景技术
近年来,语音识别技术成为了信息技术领域中的重要的发展技术之一。语音识别技术使人们能够甩掉键盘,通过语音命令进行操作,使语音识别技术在众多领域得到广泛应用。
语音识别技术是将声音转变成文本的技术。目前采用语音模型和语言模型结合的方式,实现对语音的识别,其中,语音模型用来描述语音信号的分布特性,而语言模型用于识别语音信号对应的词序列,用以限制系统能识别的句子范围,语言模型基于一个系统词表,只有在词表中出现的词才有可能被识别出来。
随着信息社会的快速发展,新生的词汇不断涌现,例如:颜值、吐槽、洪荒之力等等,由于新的词汇不在语音识别的系统词表中,因此很难被识别出来。
发明内容
本申请实施例提供了一种语音识别的方法和装置,以解决目前无法识别新词和新词快速添加的问题。
为了解决上述问题,本申请公开了一种语音识别的方法,包括:
将语言模型表示为有限状态转移机;
待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;
将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。
优选的,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:
根据静态配置获得新词对应的近义词。
优选的,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:
将所述新词映射到向量空间,获得第一向量;
将语言模型的词表中的词映射到向量空间,获得第二向量;
根据所述第一向量和所述第二向量利用余弦距离公式,获得新词和所述词表中的词之间的相似度;
将所述相似度高的所述词表中的词确定为新词对应的近义词。
优选的,将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机的步骤包括:
将所述获得新词和所述词表中的词之间的相似度与近义词的权重的乘积作为新词的权重;
将所述新词和所述新词的权重并列添加在所述有限状态转移机中的近似词处,获得更新后的有限状态转移机图。
为了解决上述问题,本申请还公开了一种语音识别的装置,包括:
转换模块,用于将语言模型表示为有限状态转移机;
近义词模块,用于待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;
更新模块,用于将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。
优选的,近义词模块包括:
配置子模块,用于根据静态配置获得新词对应的近义词。
优选的,近义词模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219528.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:侧贴钢板式混凝土组合连梁
- 下一篇:一种单页双曲面配筋混凝土柱及其制作方法