[发明专利]语音识别方法有效
| 申请号: | 201810685178.2 | 申请日: | 2018-06-28 |
| 公开(公告)号: | CN109215637B | 公开(公告)日: | 2023-09-01 |
| 发明(设计)人: | 金珉洙;徐智炫;安憬准;金昇暻 | 申请(专利权)人: | 三星SDS株式会社 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06;G10L25/24;G10L15/22 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 车玉珠;康泉 |
| 地址: | 韩国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 | ||
1.一种语音识别方法,该方法为由语音识别装置执行的关于识别对象语言的语音识别方法,其特征在于,包括以下步骤:
获取关于所述识别对象语言的原始学习数据组,其中包含在所述原始学习数据组中的各个原始学习数据包含学习用语音数据及与所述学习用语音数据对应的文本信息;
通过将包含在所述各个原始学习数据中的文本信息以字母为单位进行分离来构成目标标签;以及
通过学习包含在所述各个原始学习数据中的学习用语音数据及与所述学习用语音数据对应的目标标签,构建基于深度神经网络的声学模型,
其中,构成所述目标标签的步骤包括:
构成第一级别目标标签,使得在分离出的所述字母中,不同的字母被定义为彼此不同的类;
构成第二级别目标标签,使得在分离出的所述字母中,不同的字母被定义为彼此不同的类,并且即便是相同的字母,不发音的字母和发音的字母也被定义为彼此不同的类;
构成第三级别目标标签,使得在分离出的所述字母中,不同的字母被定义为彼此不同的类,并且即便是相同的字母,在排列位置不同的情况下也被定义为彼此不同的类;以及
构成第四级别目标标签,使得在分离出的所述字母中,不同的字母被定义为彼此不同的类,即便是相同的字母,不发音的字母和发音的字母也被定义为彼此不同的类,并且即便是相同的字母,在排列位置不同的情况下也被定义为彼此不同的类。
2.根据权利要求1所述的语音识别方法,其特征在于,
所述目标标签包含分写,所述分写包含在所述文本信息中,
其中所述分写在所述声学模型中被定义为单独的类。
3.根据权利要求1所述的语音识别方法,其特征在于,
在包含于所述目标标签的相同的字母中,发音的字母和不发音的字母在所述声学模型中被定义为彼此不同的类。
4.根据权利要求1所述的语音识别方法,其特征在于,
构建所述声学模型的步骤包括:
利用连接时序分类方法来更新构成所述声学模型的深度神经网络的加权值。
5.根据权利要求1所述的语音识别方法,其特征在于,
所述深度神经网络包含递归神经网络、双向递归神经网络、长短期记忆、双向长短期记忆、门控循环单元和双向门控循环单元中的至少一种。
6.根据权利要求1所述的语音识别方法,其特征在于,
所述识别对象语言为韩语,
在包含于所述目标标签的相同的辅音中,排列位置为初声的辅音和排列位置为终声的辅音在所述声学模型中被定义为彼此不同的类。
7.根据权利要求6所述的语音识别方法,其特征在于,所述方法进一步包括:
被输入识别对象语音数据;
利用构建出的所述声学模型来预测所述识别对象语音数据的目标标签,其中预测出的所述目标标签包含排列位置为终声的第一辅音;
从已定义的单词词典中提取与预测出的所述目标标签相关联的候选单词;以及
以所述候选单词为基础,输出与所述识别对象语音数据对应的文本信息,
其中所述候选单词只包含所述第一辅音位于终声的单词。
8.根据权利要求1所述的语音识别方法,其特征在于,
构建所述声学模型的步骤包括:
利用图形处理器及并非所述图形处理器的其他处理单元来学习所述声学模型,
其中由所述图形处理器处理的运算量随着所述声学模型中定义的类的个数增加而增加。
9.根据权利要求1所述的语音识别方法,其特征在于,
构建所述声学模型的步骤包括:
通过学习包含在所述各个原始学习数据中的学习用语音数据及与所述学习用语音数据对应的第一级别目标标签至第四级别目标标签中的两个以上的目标标签,构建多个候选声学模型;
利用k折交叉验证方法来评价所述多个候选声学模型;以及
以评价的结果为基础,在所述多个候选声学模型中确定所述识别对象语言的声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810685178.2/1.html,转载请声明来源钻瓜专利网。





