[发明专利]语音识别方法及装置有效
申请号: | 202011639563.7 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112802455B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 李健;常乐;陈明;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/26;G10L15/18 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 黄海英 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
确定待识别语音数据所属的目标业务部门,并获取所述目标业务部门对应的目标租户下的语音识别资源,其中,所述目标业务部门为目标组织机构的多个业务部门之一的部门,所述目标租户为所述目标组织机构对应的多租户系统中的租户,所述目标租户下的语音识别资源至少包括以下之一:所述目标业务部门的热词、动态语言模型,所述动态语言模型由所述目标业务部门的语料训练得到;
确定所述目标租户所属的所述多租户系统对应的语音识别系统,其中,所述语音识别系统中的语言模型由所述目标组织机构的语料训练得到;
基于所述语音识别系统以及所述目标租户下的语音识别资源,对所述待识别语音数据进行识别,得到目标文本数据,包括:
基于所述语音识别系统以及所述目标租户下的动态语言模型,对所述待识别语音数据进行识别,得到所述目标文本数据;或
基于所述语音识别系统以及所述目标租户下的热词,对所述待识别语音数据进行识别,得到所示目标文本数据。
2.根据权利要求1所述的方法,其特征在于,在确定待识别语音数据所属的目标业务部门,并获取所述目标业务部门对应的目标租户下的语音识别资源之前,所述方法还包括:
确定所述目标组织机构包含的业务部门,并基于所述目标组织机构包含的业务部门构建多租户系统,其中,所述多租户系统中的每个租户对应一个所述目标组织机构中的每个业务部门;
获取所述目标组织机构运行的过程中产生的语料,基于所述语料训练得到所述语言模型,并建立所述语言模型与所述多租户系统之间的关联关系;
分别获取所述目标组织机构中的每个业务部门运行的过程中产生的语料,分别基于每个所述业务部门的语料确定所述业务部门的语音识别资源,并建立所述业务部门的语音识别资源与所述业务部门对应的租户之间的关联关系。
3.根据权利要求1所述的方法,其特征在于,基于所述语音识别系统以及所述目标租户下的动态语言模型,对所述待识别语音数据进行识别,得到所述目标文本数据包括:
基于所述语音识别系统中的声学模型对所述待识别语音数据进行识别,得到音素序列;
基于发音词典确定所述音素序列对应的第一文本数据;
基于所述语音识别系统中的语言模型对所述第一文本数据进行调整,得到第二文本数据;
基于所述目标租户下的动态语言模型,对所述第二文本数据进行调整,得到所述目标文本数据。
4.根据权利要求1所述的方法,其特征在于,所述热词至少包括以下之一类型:
解码调整热词,用于在所述语音识别系统的语言模型中的解码网络中建立新的解码路径;
文本替换热词,用于对所述语音识别系统输出的文本数据中的目标词汇进行替换,其中,所述目标词汇是与所述文本替换热词具有关联关系的词汇;
音素替换热词,用于对所述语音识别系统中的声学模型输出的音素序列中的目标音素进行替换,其中,所述目标音素是与所述音素替换热词具有关联关系的音素。
5.一种语音识别装置,其特征在于,包括:
第一确定单元,用于确定待识别语音数据所属的目标业务部门,并获取所述目标业务部门对应的目标租户下的语音识别资源,其中,所述目标业务部门为目标组织机构的多个业务部门之一的部门,所述目标租户为所述目标组织机构对应的多租户系统中的租户,所述目标租户下的语音识别资源至少包括以下之一:所述目标业务部门的热词、动态语言模型,所述动态语言模型由所述目标业务部门的语料训练得到;
第二确定单元,用于确定所述目标租户所属的所述多租户系统对应的语音识别系统,其中,所述语音识别系统中的语言模型由所述目标组织机构的语料训练得到;
识别单元,用于基于所述语音识别系统以及所述目标租户下的语音识别资源,对所述待识别语音数据进行识别,得到目标文本数据;
所述识别单元包括:
第一识别模块,用于基于所述语音识别系统以及所述目标租户下的动态语言模型,对所述待识别语音数据进行识别,得到所述目标文本数据;或
第二识别模块,用于基于所述语音识别系统以及所述目标租户下的热词,对所述待识别语音数据进行识别,得到所示目标文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011639563.7/1.html,转载请声明来源钻瓜专利网。