[发明专利]一种基于深度学习的空中管制语音降噪方法在审
| 申请号: | 202110413991.6 | 申请日: | 2021-04-17 |
| 公开(公告)号: | CN113129919A | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 顾毅陶;李鑫;王宏锋 | 申请(专利权)人: | 上海麦图信息科技有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0224;G10L21/0232;G06N3/08;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200000 上海市徐*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 空中管制 语音 方法 | ||
本发明公开了一种基于深度学习的空中管制语音降噪方法,步骤如下:获取待降噪音频,将其转换为16bit/16kHz的PCM音频数据,并通过短时傅里叶变换由时域转换为频域;建立深度网络模型;建立空管音频训练数据集和标签数据集;利用训练数据训练深度网络模型得到降噪模型;待降噪音频经短时傅里叶变换后输入到降噪模型,并与短时傅里叶变换分离得到的相位信息进行点积操作,然后通过逆短时傅里叶变换生成降噪音频。本发明深度网络模型使用带有长连接的Encoder‑Decoder模型来进行特征提取,并且通过1X1卷积核对提取的特征数据进行处理,生成降噪语音。本发明具有极强的降噪能力和泛化能力,降噪后的音频能保留较高的信噪比。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于深度学习的空中管制领域的语音降噪方法。
背景技术
随着民航业快速发展,每年都增加大量的飞机和航班。然而空中管制人员却长期存在缺口,保守估计也有数千人之多。即使空管相关单位对此实施了一系列方法,比如4+1培养机制等方案,但空管人员依然存在大量流失的现象。同时又因为新进人员经验不足、培训时间和资源的缺乏等问题,导致无法发挥相应的人员效益。空管行业人员紧张导致了空管人员超负荷工作的问题,致使空中交通存在潜在的安全问题和效率问题。当前中国的空中交通管制仍是以管制员主观决策为主的高强度脑力劳动,飞机班次随着民航的蓬勃发展而大大增多,而人手不足的空管目前又只能依赖管制员进行长时间高强度专注集中工作,人为失误在所难免。据统计,人为差错引发的航空事故占到了航空事故总量的80%,已经成为影响航空安全的重要原因。因此,有必要引入语音识别系统,实时发送与记录管制员和飞行员的指令和回复语音,从而减少理解歧义和遗忘等情况。当前,随着人工智能技术的发展,基于深度学习技术的端到端语音识别模型日趋成熟。然而在语音识别的前端工作中,输入语音管制语音由于设备和无线电流的影响,存在大量的不规则噪音和强底噪,将会极大地影响语音识别的准确率。因此,有必要进行管制语音的降噪处理,建立一个基于深度学习的语音降噪模型,将管制语音输入到对应的降噪音引擎中进行降噪处理。
现有相关技术中,对语音进行降噪的方法主要有谱减法音频降噪处理和和滤波器降噪处理。谱减法音频降噪处理是通过将音频信号从时域转换到频域,再从频域中的信号减去噪音信号来进行降噪。由于声音的幅度不一样,在谱减的过程中会出现负数,谱减的做法是统一作为0来处理。然而,这样做的坏处会导致降噪后的语音声音信号丢失,影响语音的自然程度。滤波器降噪处理是通过设计不同种类的降噪滤波器,从音频信号中减弱特定噪音信号的影响。缺点是对于噪音的可扩展性较差,不能够自适应地对不同噪音进行处理,降噪的泛化性较差。
2017年,百度在线网络技术(北京)有限公司尝试使用人工智能的方法来进行语音降噪,做法是通过对带噪语音进行采样,再通过深度学习降噪模型对带噪语音进行降噪,生成干净语音。然而,其本身对降噪模型的参数比较复杂,在实时降噪转换方面表现较差。2018年,大象声科(深圳)科技有限公司尝试使用一种基于卷积递归神经网络的单通道实时降噪方法,将当前时间帧与过去时间帧的频谱幅度矢量合并归一化来形成声学特征。然而这种方法受限于已有的语音数据库,对于空管语音的降噪效果不佳。
发明内容
本发明旨在构建一套专门用于空中管制语音的降噪系统。本系统基于深度学习技术构建,采用监督式学习方法,能够有针对性地对空管语音常见的噪音信号进行降噪处理,同时降噪后的音频能保留较高的信噪比,具有更好的自然度和音质。
为了实现上述效果,本发明提供的技术方案如下:
一种基于深度学习的空中管制语音降噪方法,包括以下步骤:
S1:获取待降噪音频,将其转换为16bit 、16kHz的脉冲编码调制(PCM)音频数据;
S2:将S1生成的PCM音频数据通过短时傅里叶变换(STFT)由时域转换为频域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦图信息科技有限公司,未经上海麦图信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110413991.6/2.html,转载请声明来源钻瓜专利网。





