[发明专利]数字串的语音识别方法及装置有效
申请号: | 201911214497.6 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111145727B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 范红亮 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18;G10L15/26 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字串 语音 识别 方法 装置 | ||
本发明是关于数字串的语音识别方法及装置。该方法包括:建立数字串的发音词典;基于所述发音词典建立多类别数字串词条;根据所述多类别数字串词条,构建领域语言模型;根据所述领域语言模型,对包含数字串的语音进行识别。通过本发明的技术方案,可利用数字串建立的领域语言模型对语音数字进行快速识别,以提高包含数字串的语音的识别效率和识别准确率。
技术领域
本发明涉及终端技术领域,尤其涉及数字串的语音识别方法及装置。
背景技术
目前,在对语音进行识别时,数字串语音识别率较低,特别是在一些特定场景中(如电话号码识别,身份证号识别,银行卡号识别等),数字识别率远远无法满足业务需要。
例如:“一”,“四”,“五”,“七”等数字连读时极易产生插入和删除错误;“一”和“七”易混淆,“四八”容易混淆为“是吧”,“九八”容易混淆为“酒吧”等发音相近或相同的词等。
发明内容
本发明实施例提供了数字串的语音识别方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种数字串的语音识别方法,包括:
建立数字串的发音词典;
基于所述发音词典建立多类别数字串词条;
根据所述多类别数字串词条,构建领域语言模型;
根据所述领域语言模型,对包含数字串的语音进行识别。
在一个实施例中,所述建立数字串的发音词典,包括:
确定至少包含两个数字的若干类数字串,其中,每类数字串中的数字的数目不同,且所述每类数字串包括至少一个数字串;
将所述若干类数字串转换成对应的汉字;
根据所述若干类数字串和所述对应的汉字,建立所述发音词典。
在一个实施例中,所述基于所述发音词典建立多类别数字串词条,包括:
基于所述发音词典中的若干类数字串建立多类别数字串词条,其中,所述若干类数字串的每类数字串与所述多类别数字串词条的每类别数字串词条相对应,相对应的所述每类数字串与所述每类别数字串词条中的数字个数相同。
在一个实施例中,所述根据所述多类别数字串词条,构建领域语言模型,包括:
确定多个数字串应用场景;
根据所述多个数字串应用场景以及所述多类别数字串词条,建立句法规则;
根据所述句法规则,构建所述领域语言模型。
在一个实施例中,所述根据所述句法规则,构建所述领域语言模型,包括:
根据所述句法规则,建立基于类的语言模型;
根据所述基于类的语言模型以及通用语言模型,构建所述领域语言模型。
根据本发明实施例的第二方面,提供一种数字串的语音识别装置,包括:
第一建立模块,用于建立数字串的发音词典;
第二建立模块,用于基于所述发音词典建立多类别数字串词条;
构建模块,用于根据所述多类别数字串词条,构建领域语言模型;
识别模块,用于根据所述领域语言模型,对包含数字串的语音进行识别。
在一个实施例中,所述第一建立模块包括:
第一确定子模块,用于确定至少包含两个数字的若干类数字串,其中,每类数字串中的数字的数目不同,且所述每类数字串包括至少一个数字串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911214497.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于大米加工的除尘装置
- 下一篇:一种确定模型的方法及装置