[发明专利]语音识别方法有效
| 申请号: | 201810685178.2 | 申请日: | 2018-06-28 |
| 公开(公告)号: | CN109215637B | 公开(公告)日: | 2023-09-01 |
| 发明(设计)人: | 金珉洙;徐智炫;安憬准;金昇暻 | 申请(专利权)人: | 三星SDS株式会社 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06;G10L25/24;G10L15/22 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 车玉珠;康泉 |
| 地址: | 韩国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 | ||
本发明提供一种语音识别方法。根据本发明构思的一实施例,由语音识别装置执行的关于识别对象语言的语音识别方法可包括以下步骤:获取关于所述识别对象语言的原始学习数据组;通过将包含在所述各个原始学习数据中的文本信息以字母(letter)为单位进行分离来构成目标标签(target label);以及通过学习包含在所述各个原始学习数据中的学习用语音数据及与所述学习用语音数据对应的目标标签,构建基于深度神经网络(deep neural network)的声学模型。
技术领域
本发明构思涉及一种语音识别方法及其装置。更详细而言,涉及一种如下的方法及执行该方法的装置:该方法为了提高端到端(End-to-End)语音识别的准确度,构建以深度神经网络为基础的声学模型,并且利用构建出的声学模型来识别输入的语音。
背景技术
语音识别(speech recognition)技术是指通过计算装置的分析来识别或理解如人类发出的语音等的声学信号(acoustic speech signal)的技术。以往,主要使用利用从语音数据中提取出的频率特征等来识别语音的方式,在此主要使用隐马尔可夫模型(Hidden Markov Model;HMM)。这种基于HMM的语音识别方式从语音数据中分析发音,并且通过以分析出的发音为基础组合单词或句子的过程来识别语音。
近年来,随着基于深度学习(deep learning)的机器学习(machine learning)技术的成熟,正在活跃地进行关于端到端(End-to-End)语音识别技术的研究,该端到端语音识别技术利用由深度神经网络(deep neural network)构成的声学模型来从语音数据中直接识别单词或句子等的文本,而不会经过从语音数据中分析发音的过程。
但是,到目前为止提出的端到端语音识别技术即使在识别对象语言为通过字母的组合表达一个音节的组合型语言的情况下,也不会对所组合的辅音和元音进行区分,而是将以字母(letter)为单位构成的目标标签(target label)用于学习中。例如,为了识别韩语语音,通过学习目标标签来构建声学模型,在所述目标标签中相同的字母与初声、中声及终声的排列位置无关地被定义为类。但是,由于在如此构建的声学模型中无法反映由初声、中声及终声的组合构成音节的识别对象语言的结构特性,因此具有语音识别的准确度下降的问题。
因此,为了提高端到端语音识别的准确度,需要一种通过反映识别对象语言的结构特性来学习声学模型的语音识别方法。
发明内容
本发明构思所要解决的技术问题是提供一种利用基于深度神经网络的声学模型来执行语音识别的方法及执行该方法的装置。
本发明构思所要解决的另一技术问题是提供一种通过反映识别对象语言的结构特性来学习基于深度神经网络的声学模型的方法及执行该方法的装置。
本发明构思所要解决的又一技术问题是提供一种用于生成反映了识别对象语言的结构特性的学习数据组的方法及执行该方法的装置。
本发明构思所要解决的又一技术问题是提供一种能够利用反映了识别对象语言的结构特性的学习数据组来有效地学习基于深度神经网络的声学模型的方法及执行该方法的装置。
本发明构思所要解决的又一技术问题是提供一种利用反映了识别对象语言的结构特性的多个学习数据组来构建适合各识别对象语言的最佳声学模型的方法及执行该方法的装置。
本发明构思的技术问题并不限于上面提到的技术问题,本发明构思所属技术领域的技术人员能够从以下记载中明确理解未提到的其他技术问题。
为了解决上述技术问题,本发明构思的一实施例的语音识别方法可构成反映了语言的组合原则的目标标签(Target Label),并且能够学习所构成的目标标签。
附图说明
图1是一实施例的语音识别系统的结构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810685178.2/2.html,转载请声明来源钻瓜专利网。





