[发明专利]语音识别方法及其装置在审
申请号: | 202011295150.1 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112489646A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 沈来信;朱相宇;王映新;孙明东;贾师惠 | 申请(专利权)人: | 北京华宇信息技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/08;G10L25/12 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 胡大成 |
地址: | 100084 北京市海淀区中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 及其 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取输入的语音数据;
通过解码模型解码所述语音数据,生成语音识别中间结果;
基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;
根据所述拼音与声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。
2.如权利要求1所述的语音识别方法,其特征在于,所述解码模型由声学模型、字典和语言模型共同构成。
3.如权利要求2所述的语音识别方法,其特征在于,所述语言模型为基于文本预处理语料,对前景语言模型与背景语言模型进行插值拟合生成的新的语言模型;
其中,前景语言模型为用户语言模型,权重值预设为0.5-0.8,该前景语言模型包含用户指定场景语料;背景语言模型为原有语音识别引擎的语言模型,该背景语言模型包含各场景语料。
4.如权利要求3所述的语音识别方法,其特征在于,对新生成的语言模型要进行平滑和剪枝操作;
其中,剪枝操作基于前景语言模型,对背景语言模型进行无关场景语料删除,且应保留前景语言的分支;平滑操作基于新生成的语言模型,重新分布该语言模型中所有场景语料的条件概率,且平滑操作后所有场景语料条件概率和为1。
5.如权利要求1所述的语音识别方法,其特征在于,所述核心词数据库基于文本预处理语料进行分词及统计词频,并根据词频生成对应分词权重而建立;
其中,对应分词权重通过每个词的词频除以最大词频与一个常量的和的方式来计算,所述常量取所有词频的中值。
6.如权利要求5所述的语音识别方法,其特征在于,所述核心词数据库可根据用户上传的核心词信息进行匹配,并自动推荐对应权重值,且用户可根据实际需求调整该权重值,以增加语音识别的准确性;
其中,经检索如未发现用户核心词,则将当前核心词数据库中的所有词的权重中值作为推荐值。
7.如权利要求1所述的语音识别方法,其特征在于,所述匹配结果为语音识别中间结果在数据库中存在对应的拼音与语调序列时,对该拼音与语调序列进行核心词替换。
8.如权利要求7所述的语音识别方法,其特征在于,所述核心词进行替换时,若包含替换序列的句子的语言模型混淆度相比于原有句子降低一个阈值,则可完成核心词序列替换,并输出包含替换序列的语音识别中间结果;
其中,降低的一个阈值,可以根据实际环境进行调整。
9.如权利要求8所述的语音识别方法,其特征在于,在执行所述包含替换序列的句子作为语音识别结果输出的步骤之前,还包括对该包含替换序列的句子进行断句及标点预测。
10.一种语音识别装置,其特征在于,包括:
语音接收模块,用于接收语音数据;
语音解码模块,用于解码所述语音数据,生成语音识别中间结果;
语音识别中间结果匹配模块,用于对语音识别中间结果与数据库中核心词拼音与声调序列进行匹配;
语音识别结果输出模块,用于根据所述拼音与声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华宇信息技术有限公司,未经北京华宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011295150.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种螺纹钢切割装置
- 下一篇:一种PHEMA水凝胶及其制备方法