[发明专利]基于神经网络的语音增强方法、装置、终端和介质在审
申请号: | 202011396463.6 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112562716A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 王春丽;王园利;王全宇 | 申请(专利权)人: | 兰州交通大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0264;G10L21/0272;G10L25/30;G10L25/45 |
代理公司: | 北京金宏来专利代理事务所(特殊普通合伙) 11641 | 代理人: | 陆华 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 语音 增强 方法 装置 终端 介质 | ||
本申请提供基于神经网络的语音增强方法、装置、终端和介质,其中所述方法包括:获取麦克风阵列的各阵元采集到的多路带噪语音信号;对所述多路带噪语音信号采用快速独立分量分析算法fastICA进行解混,得到多路分离信号;采用误差反向传播神经网络BPNN预测最佳过减因子;根据神经网络预测的最佳过减因子,采用多窗谱谱减法对所述解混后信噪比最高的一路分离信号进行语音处理,得到语音增强信号。本申请采用误差反向传播神经网络BPNN预测最佳过减因子,能够使寂静区更加平滑,提升语音质量。
技术领域
本申请属于语音信号处理技术领域,具体涉及基于神经网络的语音增强方法、装置、终端和介质。
背景技术
人工神经网络(ANN)简称神经网络,从二十世纪末开始蓬勃发展直到今天。它可以模拟人脑内神经元之间的连接工作,并实现学习计算。神经网络通过神经元之间的层级衔接、层级传递并处理数据,运用强大的映射能力,由底至顶的学习训练,解决实际生活中的非线性问题。
神经元是神经网络中最基本的单元,抽象模仿人脑的神经元的工作,相当于一个多输入单输出的元器件。神经元的数学模型如图1所示,xi表示输入信号,wi和b表示权值和偏置,Yi表示输出,有:Yi=f(∑xiwi-b)。其中f(·)为传输函数,常见的有硬极限传输函数、线性传输函数以及对数S型传输函数。
误差反向传播神经网络(BPNN)是应用很广泛的一种。BPNN是多层前向网络,构造了非线性系统,性能参数是均方误差,该模型可以解决不收敛问题。BPNN的结构如图2所示,有输入层、隐藏层和输出层,隐藏层可以不止一层。
BPNN是由输入信号的前向传播以及误差信号的反向传播两部分组成。具体过程可简述为:输入信号先进入输入层,经过隐藏层最后到达输出层,当输出层的输出值与期望的输出值不相符时,产生一个误差信号。这个误差从输出层进入,经过隐藏层后到输入层,每层神经元根据误差信号不断调整自己的数值。BPNN的学习过程就是这两部分不断循环进行,各神经元参数也在不断调整的过程。
麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。麦克风按照指定要求排列后,加上相应的算法(排列+算法)就可以解决很多房间声学问题,比如声源定位、去混响、语音增强、盲源分离等。
语音增强算法从上世纪开始发展迅速,随着其他学科例如神经网络等的兴起,越来越多的新方法被提出。语音增强是指当语音信号被各种各样的噪声(包括语音)干扰甚至淹没后,从含噪声的语音信号中提取出纯净语音的过程。
其中针对麦克风阵列的语音增强算法有固定波束形成算法、广义旁瓣相消法、后置滤波算法以及盲源分离算法。固定波束形成算法结构简单,运算量小,但是所需麦克风数目较多,不能去除相关噪声;广义旁瓣相消法可以去除相关噪声,但是去噪性能受麦克风数量影响;后置滤波算法不能去除相关噪声;盲源分离算法会有分离信号排序不定的问题。
针对单麦克风的语音增强算法通常包括维纳法和谱减法,其中谱减法又包括基本谱减法和多窗谱估计的谱减法(MWS)。基本谱减法能简单的去加性噪声,原理是将接收信号功率谱中去掉噪声信号的功率谱,以此得到语音信号的功率谱,达到去噪效果,然而却同时具备了显著的“音乐噪声”。为了有效去除基本谱减法中的“音乐噪声”,多窗谱估计被提出,即用多个正交的窗对输入信号“加窗”分帧求平均谱,获得的谱估计具备较小的估计方差。利用多窗谱估计可以增大过减因子,去除“音乐噪声”,实现语音增强。但是如果过减因子过大,又会引起语音失真。
综上,现有的语音增强算法中仍然没有一种能够适应各种环境进行良好去噪,导致语音相关产品的用户体验不佳。
发明内容:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州交通大学,未经兰州交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011396463.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线远程监控装置及其使用方法
- 下一篇:一种续航能力强的高能铅酸蓄电池