[发明专利]一种蒙古语语音特征融合方法及装置有效
申请号: | 202110920515.3 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113643688B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 刘志强;马志强;陈艳 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 韩迎之 |
地址: | 010051 内蒙古自治*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蒙古语 语音 特征 融合 方法 装置 | ||
本发明公开了一种蒙古语语音特征融合方法及装置,其中方法包括:获取原始蒙古语语音数据;对所述原始蒙古语语音数据进行提取,得到蒙古语声学特征以及蒙古语个性特征;将所述蒙古语声学特征以及所述蒙古语个性特征利用门控融合机制进行融合,得到整体声学特征;本发明提高蒙古语语音识别说话人自适应系统的准确率。
技术领域
本发明涉及语音识别技术领域,更具体的说是涉及一种蒙古语语音特征融合方法及装置。
背景技术
目前,蒙古语中包含百万以上的蒙古语单词并且在不断引入新的词汇,对于蒙古语语音识别的研究仍旧处于初级阶段。
在基于深度神经网络-隐马尔可夫声学模型(Deep Neural Network-HiddenMarkov Model,DNN-HMM)中已经提出了许多自适应方法,按照自适应采用的方法可以分为三类,第一种是基于线性变换的自适应方法,通过对深度神经网络的输入特征或隐层特征进行变换来实现自适应,主要应用于自适应数据量较少时,当自适应数据量较多时,特征变换参数量无法表达较多和较复杂的模式;第二种是基于模型重训的自适应方法,利用目标说话人的自适应数据,直接进行声学模型参数的更新,当自适应数据量足够多的时候,基于模型重训的说话人自适应方法可以最大程度的利用自适应数据,但是在实际中无法提供足够的说话人数据来满足数据量要求;第三种是基于辅助特征的自适应方法,将表达说话人信息的特征向量替换或者融合传统声学特征后,再进行声学模型的训练,使声学模型利用说话人信息减小说话人的差异性。其中有一种基于特征最大似然线性回归(feature-spaceMaximum likelihood Linear Regression,f-MLLR)的方法,该方法首先利用说话人无关的高斯混合模型进行声道长度规整,然后获得每个说话人的fMLLR特征后替换掉传统的频谱特征进行神经网络的训练。随后,将己经在说话人识别领域取得成功应用的i-vector和d-vector技术融合声学特征用于说话人自适应。基于辅助特征的说话人自适应方法是一种比较常用的声学模型说话人自适应方法,增强声学模型对说话人信息的感知能力,辅助特征的中的融合特征方法是将输入分成两部分,一部分是声学特征用于声学单元的区分,另一部分是辅助特征用于描述说话人信息的说话人特征,因此训练过程和自适应过程同时进行。在训练过程中网络参数随着说话人信息的不同而动态变化,减小说话人之间的差异性,但当包含不同说话人信息的说话人特征作为辅助特征与神经网络输入声学特征进行融合时,往往采用拼接的方法对声学特征和说话人特征进行固定筛选,使得声学模型训练过程中不适应说话人信息的变化,导致声学模型自适应效果较差。另外,声学特征和说话人特征属于不同的特征表达空间,直接进行简单的拼接意味着将全局信息与局部信息直接进行融合,增加后续声学模型的建模难度。
因此,如何提供一种能够解决上述问题的蒙古语语音特征融合方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种蒙古语语音特征融合方法及装置,可以用于表征不同地区蒙古语口音特点的说话人信息提取方法,进而得到融合蒙古语声学信息和说话人个性特征的蒙古语语音特征,提高蒙古语语音识别说话人自适应系统的准确率。
为了实现上述目的,本发明采用如下技术方案:
一种蒙古语语音特征融合方法,包括:
获取原始蒙古语语音数据;
对所述原始蒙古语语音数据进行提取,得到蒙古语声学特征以及蒙古语个性特征;
将所述蒙古语声学特征以及所述蒙古语个性特征利用门控融合机制进行融合,得到整体声学特征。
优选的,得到蒙古语声学特征的过程具体包括:
对所述蒙古语语音数据提取FBANKs特征;
对所述FBANKs特征通过自注意力机制提取所述FBANKs特征内部信息的依赖关系,并分配权重,得到对应的所述蒙古语声学特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110920515.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光电子倍增器
- 下一篇:一种建筑围护结构传热系数测定装置及方法