[发明专利]一种语音识别方法、装置、设备及存储介质有效
| 申请号: | 201811556515.4 | 申请日: | 2018-12-19 |
| 公开(公告)号: | CN109461438B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 方昕;刘海波;汪睿;方磊 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 识别 方法 装置 设备 存储 介质 | ||
本申请提出一种语音识别方法、装置、设备及存储介质,其中,该方法包括:提取待识别语音数据的语音特征;根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息;根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容。上述语音识别的处理过程识别得到的内容包括语音内容的属性信息和具体的语音内容两方面的信息,可以有效避免由于无法区分语音内容的属性而出现识别混淆的现象,利于提升语音识别准确度。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、设备及存储介质。
背景技术
端到端的语音识别模型可以对输入的语音数据进行单字、单词的识别,并将识别到的单字、单词合并得到整词或语句。如汉语语音识别模型常将汉字或词语作为建模单元,通过学习输入语音数据与输出汉字或词语之间的对应关系,识别输入语音数据中所包含的汉字或词语,然后由识别得到的汉字或词语合并得到识别文本。
有些语种的单字或单词等具有属性特征,用于规定其组成整词或整句时的用法。甚至某些语种的单字或单词具有多重属性,例如在很多黏着语语种中,作为语句元素的某些子词是既能作为词干,又能作为词缀的,当子词作为词干或词缀的属性不同时,其与相邻子词的格属关系不同,构成的整词或语句也不同。而上述端到端的语音识别模型只是单纯地建立语音数据与单字或单词内容的对应关系,对识别到的单字或单词直接进行拼接得到识别结果。当训练不充分时,经常出现单字或单词识别混淆、识别结果拼接错误的现象,导致语音识别不准确。
发明内容
基于上述现有的语音识别技术中存在的问题,本申请提出一种语音识别方法、装置、设备及存储介质,用以解决语音识别中存在的识别混淆问题,从而提高语音识别准确度。该技术方案具体如下:
一种语音识别方法,包括:
提取待识别语音数据的语音特征;
根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息;
根据所述语音特征,以及所述待识别语音数据的语音内容的属性信息,确定所述待识别语音数据的语音内容。
可选的,所述属性信息包括语言成分信息,所述语言成分信息表示语音内容在其所构成的整词和/或语句中的成分属性;
相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,包括:
将所述语音特征输入预先训练的第一解码模型,解码得到所述待识别语音数据的语音内容的语言成分信息;其中,所述第一解码模型至少根据已标注待识别内容的语言成分信息的解码训练特征样本训练得到。
可选的,所述属性信息还包括词性类型信息;
相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,还包括:
将所述语音特征,以及所述待识别语音数据的语音内容的语言成分信息,输入预先训练的第二解码模型,解码得到所述待识别语音数据的语音内容的词性类型信息;其中,所述第二解码模型至少根据已标注待识别内容的语言成分信息和词性类型信息的解码训练特征样本训练得到。
可选的,所述属性信息包括语言成分信息及词性类型信息;其中,所述语言成分信息表示语音内容在其所构成的整词和/或语句中的成分属性;
相应的,所述根据所述语音特征,确定所述待识别语音数据的语音内容的属性信息,包括:
将所述语音特征输入预先训练的第三解码模型,解码得到所述待识别语音数据的语音内容的语言成分信息及词性类型信息;其中,所述第三解码模型至少根据已标注待识别内容的语言成分信息及词性类型信息的解码训练特征样本训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811556515.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:唇语识别的验证内容生成方法及相关装置
- 下一篇:一种语音信息指令的采集方法





