[发明专利]一种语音识别方法和语音识别系统有效

专利信息
申请号: 201710015475.1 申请日: 2017-01-10
公开(公告)号: CN107093422B 公开(公告)日: 2020-07-28
发明(设计)人: 陈桂林 申请(专利权)人: 上海优同科技有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/14;G10L15/16;G10L15/183;G10L15/22;G10L15/30
代理公司: 上海骁象知识产权代理有限公司 31315 代理人: 赵俊寅
地址: 201203 上海市浦东新区中国(*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 识别 方法 系统
【说明书】:

发明提供了一种语音识别方法和语音识别系统,其中,所述语音识别方法包括一下步骤:对获取的语音信号进行预处理;从所述语音信号中提取特征参数;采用语言模型和基于长短时记忆模型结构建立得到的声学模型对所述语音信号进行自动识别;对自动识别得到的语音信号进行后处理。根据本发明,采用长短时记忆模型结构可以表征更长时间内的基音曲线,提高建模精度以及语音识别精度。

技术领域

本发明涉及语音识别领域,尤其涉及一种语音识别方法和语音识别系统。

背景技术

语音识别,也称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类语音转换为计算机可读的文字或指令,是模式识别的一个重要分支。一个完整的语音识别系统一般包括语音信号预处理、特征提取、模型训练、声学模型、语言模型以及自然语言后处理等几大模块。

其中,声学模型的主要作用是用来辨识用户发什么样的音。对于一门具体的语言来说,需要采集该门语言数量众多的发音人的数据来进行训练,而且这些数据需要将对应的文字标记出来。近30年来,语音识别的声学模型建模方法有隐马尔科夫模型(HiddenMarkov Model,HMM)、高斯混合模型(Gaussian Mixture Model,GMM)以及目前占主流地位的深度神经网络模型(DNN/CNN/RNN)等。

目前语音识别技术路线为语言相关、说话人无关的统计模式识别技术,不同语言之间由于音系、音段和韵律表现方面的差异,声学模型的建模方法可以略有差异。西方语言(如英语、法语和德语等等)绝大多数都是不带调的语言,建立声学模型时,可忽略基音信息,对最终系统的识别精度几无影响。而中文普通话是一种带调的语言,普通话一般可分为5个声调:第一声(阴平)、第二声(阳平)、第三声(上声)、第四声(去声)、第五声(轻声),这对于普通话的辨音识义非常重要。普通话里边存在大量的拼音相同但音调不同的词汇,如“睡觉”和“水饺”等等。这就需要我们在设计和实现普通话语音识别系统时,有必要显式考虑音调的因素。在模型训练阶段,将基音信息充分考虑进去。并在识别解码阶段,正确运用相关模型辅助判决。

在语音信号分析过程中,语音信号中往往有清音(unvoiced)段和浊音(voiced)段。一般认为清音段没有基音(或者说基音),浊音段有基音(或者说基音)。这种特性对基音建模有直接影响。

基音信息在普通话的声调辨识中起着重要作用。

其中,在声学模型的各种模型中,比如:将基音信息作为一维特征与谱参数的多维特征组成联合特征,进行模型训练。在HMM/GMM中,以一个流(stream)进行处理。这种方法的问题是:由于清音段没有基音,只能通过插值来补全,与实际情况偏差很大,而且逐帧求出的基音值很难准确,最终的效果并不理想。

考虑到清音段无基音和浊音段有基音这种特点,利用MSD(Multi-SpaceDistribution)模型对基音进行建模。这种方法对处理清音和浊音的二元特性比较有效,但仍不能充分反映相邻帧之间基音上的相关性。

再比如:利用深度神经网络(Deep Neural Network)将基音和谱参数一起建模,但特征不具有归一化,谱参数和基音在解码时不分离,易引入额外的误差,导致识别精度降低。

为此,亟待提供一种识别精度高的建模方式。

发明内容

本发明的目的是提供一种在声学模型中建模精度高、识别精度高的语音识别方法和语音识别系统。

根据本发明的一个方面,提供一种语音识别方法,其中,所述语音识别方法包括以下步骤:

对获取的语音信号进行预处理;

从所述语音信号中提取特征参数;

采用语言模型和基于长短时记忆模型结构建立得到的声学模型对所述语音信号进行自动识别;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海优同科技有限公司,未经上海优同科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710015475.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top