[发明专利]一种语音识别方法及系统在审

专利信息
申请号: 202010696240.5 申请日: 2020-07-20
公开(公告)号: CN111862962A 公开(公告)日: 2020-10-30
发明(设计)人: 汪秀英 申请(专利权)人: 汪秀英
主分类号: G10L15/20 分类号: G10L15/20;G10L21/0208;G10L21/0272;G10L15/02;G10L15/06
代理公司: 长沙正务联合知识产权代理事务所(普通合伙) 43252 代理人: 郑隽;吴婷
地址: 410205 湖南省长沙市高新*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 识别 方法 系统
【说明书】:

发明涉及一种语音识别的技术领域,揭露了一种语音识别方法,包括:获取待识别语音信号,并计算待识别语音信号的能量密度谱;将能量密度谱进行伪彩色映射,得到待识别语音信号的彩色语谱图;利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除;利用盲源分离算法估计待识别语音中目标语音信号的mask值;利用基于mask值的多通道增强算法对目标语音信号进行增强;利用预训练的DFSMN‑CTC模型对语音信号进行识别,得到语音识别结果。本发明还提出一种语音识别系统。本发明实现了语音的识别。

技术领域

本发明涉及语音识别的技术领域,尤其涉及一种语音识别方法及系统。

背景技术

近年来,随着移动互联网的兴起和智能手机等移动终端的普日益及,自然人机交互技术受到广泛关注并发展迅速。语音识别技术是自然人机交互的重要桥梁,能够大力地促进人工智能的发展。但是,现实生活中,不管是机器还是人类接受到的语音信号都是通过空气等媒介才能间接地传递过来,因此,这些声波信号极易受到各种噪声干扰以及不同环境存在的回声、混响等影响导致失真,甚至在更复杂的声学场景下,还会把目标语音完全掩盖,这就对语音识别系统在真实场景中的应用提出了巨大的挑战。

传统声学模型训练时,为了得到每个音素对应的发音模型,必须准确得到每个音素对应的特征,亦即执行所谓的对齐操作,如在GMM-HMM模型中,为了使对齐准确,往往需要根据每次训练之后,根据损失值进行对齐多次,且在噪声环境下对齐操作极易受噪声的干扰,这种对齐错位将导致模型出现插入错误与替换错误。

同时为提升噪声环境下语音识别系统的鲁棒性,现有技术大多采用基于子空间的语音增强算法和谱减法进行待识别语音的增强处理,其中,基于子空间的语音增强算法利用线性代数中的基础理论,将带有噪声的语音信号分解为两个独立的子向量空间,分别由噪声和干净语音作为主导,然后只保留干净语音信号所在的分量,来还原期望的干净语音信号,但是子空间法的问题在于矩阵分解的计算量大且结构繁杂,并不利于实际工程应用;谱减法具有算法结构简单、计算复杂度低的优点,因此在当前语音识别工程应用中最为常用,但是,谱减法在计算时会采用半波整流的方法保证信号幅度谱不为负数,这导致了信号在频谱上某些位置会出现毛刺,在听感上就表现为刺耳的“音乐噪声”,带来难以抑制的失真问题。

鉴于此,如何有效去除干扰说话人以及环境噪音信息,保留目标说话人的语音信息,并对目标说话人的语音信息进行识别,成为本领域技术人员亟待解决的问题。

发明内容

本发明提供一种语音识别方法,能够有效去除干扰说话人以及环境噪音信息,保留目标说话人的语音信息,并对目标说话人的语音信息进行识别。

为实现上述目的,本发明提供的一种语音识别方法,包括:

获取待识别语音信号,并计算待识别语音信号的能量密度谱;

将能量密度谱进行伪彩色映射,得到待识别语音信号的彩色语谱图;

利用自适应的时域滤波器对彩色语谱图中的语音信号进行回声消除;

利用盲源分离算法估计待识别语音中目标语音信号的mask值;

利用基于mask值的多通道增强算法对目标语音信号进行增强;

利用预训练的DFSMN-CTC模型对语音信号进行识别,得到语音识别结果。

可选地,所述计算待识别语音信号的能量密度谱,包括:

1)对待识别语音信号进行短时傅里叶变换:

其中:

x(n)为待识别语音的离散时域采样信号,n=0,1,...,N-1,n为时域采样点信号,N为语音信号的长度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪秀英,未经汪秀英许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010696240.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top