[发明专利]一种音频信号处理的方法、装置、设备和介质有效
| 申请号: | 202010093002.5 | 申请日: | 2020-02-14 |
| 公开(公告)号: | CN111312276B | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 栾天祥;冯大航;陈孝良;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/30 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 常晓 |
| 地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 音频 信号 处理 方法 装置 设备 介质 | ||
本申请公开了一种音频信号处理的方法、装置、设备和介质,属于信号处理技术领域,该方法包括,对获取的音频信号进行信号源数量分析,获得概率分布向量,概率分布向量表示音频信号中包含的信号源的数量的概率分布;根据音频信号以及训练好的信号分离模型,获得表示分离出的各信号源的分离信号的信号分离矩阵,信号分离模型是基于深度神经网络对样本信号、样本概率分布向量以及样本信号分离矩阵训练获得的;根据概率分布向量以及信号分离矩阵,获得表示估计的各分离信号的估计信号矩阵;根据估计信号矩阵,获得目标音频信号。这样,可以抑制音频信号中的噪声,增强音频信号中的目标信号,还可以降低计算量以及系统资源消耗。
技术领域
本申请涉及信号处理技术领域,尤其涉及一种音频信号处理的方法、装置、设备和介质。
背景技术
随着互联网以及智能终端技术的发展,人们可以通过语音与终端设备交互。如,车载终端设备可以对接收的用户语音进行语音分析,并根据分析结果执行相应的操作。
但是,终端设备接收的音频信号通常包含大量的噪声,如,车辆行驶中的风噪、胎噪、开关窗噪声以及引擎声等。这些噪声会对音频信号中目标语音的分析造成干扰,降低了语音分析的准确度。
由此,在处理音频信号时,如何抑制音频信号中的噪声以及增强目标信号,是一个亟待解决的问题。
发明内容
本申请实施例提供一种音频信号处理的方法、装置、设备和介质,用以在处理音频信号时,抑制音频信号中的噪声,以及增强音频信号中的目标信号。
一方面,提供一种音频信号处理的方法,包括:
获取音频信号,音频信号为多个声音采集设备采集的多个信号源的信号;
对音频信号进行信号源数量分析,获得概率分布向量,概率分布向量表示音频信号中包含的信号源的数量的概率分布;
根据音频信号以及训练好的信号分离模型,获得表示分离出的各信号源的分离信号的信号分离矩阵,信号分离模型是基于深度神经网络对样本信号、样本概率分布向量以及样本信号分离矩阵训练获得的;
根据概率分布向量以及信号分离矩阵,获得表示估计的各分离信号的估计信号矩阵;
根据估计信号矩阵,获得目标音频信号。
较佳的,对音频信号进行信号源数量分析,获得概率分布向量,包括:
当设定的信号源个数不高于获取的声音采集设备的设备数量时,将音频信号作为训练好的数量估计模型的输入数据,获得概率分布向量;
当设定的信号源个数高于获取的声音采集设备的设备数量时,采用预设的高斯混合模型,对音频信号进行聚类,获得包含设备数量的信号源的音频信号,并根据聚类后的音频信号,获得概率分布向量;
其中,数量估计模型是基于深度神经网络对样本音频信号和相应的信号源的样本数量训练获得的,高斯混合模型为基于高斯概率密度函数获得的模型。
较佳的,根据音频信号以及训练好的信号分离模型,获得表示分离出的各信号源的分离信号的信号分离矩阵,包括:
将音频信号进行频域变换,获得频域变换信号;
将频域变换信号作为信号分离模型的输入数据,获得信号分离矩阵。
较佳的,根据概率分布向量以及信号分离矩阵,获得表示估计的各分离信号的估计信号矩阵,包括:
将概率分布向量与信号分离矩阵点乘,获得估计信号矩阵。
较佳的,根据估计信号矩阵,获得目标音频信号,包括:
将估计信号矩阵进行平滑处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010093002.5/2.html,转载请声明来源钻瓜专利网。





