[发明专利]语音识别方法、装置、电子设备和存储介质在审
| 申请号: | 202110474762.5 | 申请日: | 2021-04-29 |
| 公开(公告)号: | CN113113024A | 公开(公告)日: | 2021-07-13 |
| 发明(设计)人: | 方昕;刘俊华;潘志兵;周传福 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L17/18 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张雅娜 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种语音识别方法、装置、电子设备和存储介质,其中方法包括:确定用户的待识别语音;基于预设状态转移路径,对所述待识别语音进行语音识别解码,得到语音识别结果;所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。本发明提供的语音识别方法、装置、电子设备和存储介质,基于当前用户的地域信息和/或历史输入信息动态扩充解码网络中的预设状态转移路径,从而基于扩充后的预设状态转移路径对该用户的待识别语音进行语音识别解码,利用该用户的个性化信息,提升了个性化语音识别的准确性,且动态扩充预设状态转移路径的方式,增强了实用性。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音识别方法、装置、电子设备和存储介质。
背景技术
随着人工智能技术的迅速发展,语音识别技术在智能家居、智能机器人等交互领域得到了广泛应用。由于语音识别使用用户的不断增多,用户之间发音习惯的差异性亦趋明显,导致通用的语音识别方法无法对所有用户均取得较好的识别效果。
现有的语音识别方法,为了实现针对各用户的个性化语音识别,从而提高语音识别准确性,通常会基于某一用户大量的历史语音数据构建针对该用户的个性化语音识别系统。然而,该方式的优化效果有限,且部署维护难度大,实用性较差。
发明内容
本发明提供一种语音识别方法、装置、电子设备和存储介质,用以解决现有技术中语音识别优化效果欠佳、实用性不足的缺陷。
本发明提供一种语音识别方法,包括:
确定用户的待识别语音;
基于预设状态转移路径,对所述待识别语音进行语音识别解码,得到语音识别结果;所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。
根据本发明提供一种的语音识别方法,所述基于预设状态转移路径,对所述待识别语音进行语音识别解码,包括:
确定所述待识别语音对应的音素序列;
基于上一解码位置对应的预设状态转移路径,对当前解码位置处的音素序列进行解码,得到当前解码位置处的解码结果。
根据本发明提供的一种语音识别方法,所述预设状态转移路径是基于如下步骤扩充的:
确定与所述用户的地域信息相关联的地域名词;
基于各地域名词扩充解码网络中地名对应的预设状态转移路径。
根据本发明提供的一种语音识别方法,所述预设状态转移路径是基于如下步骤扩充的:
基于所述用户的历史输入信息,确定当前解码位置处的音素序列对应的相似热词;
基于所述相似热词,扩展上一解码位置对应的预设状态转移路径。
根据本发明提供的一种语音识别方法,所述基于所述用户的历史输入信息,确定当前解码位置处的音素序列对应的相似热词,包括:
基于当前解码位置处的音素序列以及预先构建的发音相似矩阵,确定当前解码位置处的音素序列对应的相似音素序列;
基于所述用户的各个热词,确定与当前解码位置处的音素序列和/或所述相似音素序列对应的相似热词;所述热词是基于所述历史输入信息确定的。
根据本发明提供的一种语音识别方法,所述基于预设状态转移路径,对所述待识别语音进行语音识别解码,包括:
基于语言模型,结合所述预设状态转移路径,对所述待识别语音进行语音识别解码;
其中,所述语言模型与所述用户当前使用的设备类型对应;任一设备类型对应的语言模型是基于所述任一设备类型的应用场景文本训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110474762.5/2.html,转载请声明来源钻瓜专利网。





