[发明专利]一种多声源融合场景的人声检测方法及装置在审
| 申请号: | 202210088372.9 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114420099A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 陈晓敏;杨志景;刘庆;李灏;曾睿;江奕锋;戴宇 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 许庆胜 |
| 地址: | 510060 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 声源 融合 场景 人声 检测 方法 装置 | ||
1.一种多声源融合场景的人声检测方法,其特征在于,包括:
获取第一语音帧样本和第二语音帧样本,其中,所述第一语音帧样本为包含人声的多声源语音帧样本,所述第二语音帧样本为不包含人声的多声源语音帧的语谱图;
提取所述第一语音帧样本和所述第二语音帧样本的MFCC特征,再基于所述MFCC特征生成对应的语谱图;
利用所述第一语音帧样本和所述第二语音帧样本,对深度学习网络单元进行人声MFCC特征识别训练;
利用所述深度学习网络单元输出的人声MFCC特征,对循环神经网络单元进行人声检测训练;
基于训练完成后的深度学习网络单元与循环神经网络单元,构建人声检测模型;
获取待检测的多声源声音信号;
对所述多声源声音信号进行加窗分帧处理,得到若干个语音帧信号;
提取所述语音帧信号的MFCC特征,再基于所述MFCC特征生成所述语音帧信号的语谱图;
以所述语谱图作为所述人声检测模型的输入量,以通过所述人声检测模型的运算,获得所述多声源声音信号的人声检测结果。
2.根据权利要求1所述的一种多声源融合场景的人声检测方法,其特征在于,所述提取所述语音帧信号的MFCC特征,再基于所述MFCC特征生成所述语音帧信号的语谱图具体包括:
通过傅里叶变换处理方式,对所述语音帧信号进行频域变换,得到语音帧频谱;
通过预设的梅尔三角滤波器组,对所述语音帧频谱进行梅尔滤波处理,得到若干个滤波器组能量,再对所述滤波器组能量进行对数转换,得到所述语音帧信号的Fbank特征;
通过IDFT变换处理方式,将所述Fbank特征转换成MFCC特征;
基于所述MFCC特征生成所述语音帧信号的语谱图。
3.根据权利要求1所述的一种多声源融合场景的人声检测方法,其特征在于,所述获取待检测的多声源声音信号之后还包括:
对所述多声源声音信号的高频部分进行信号加重预处理。
4.根据权利要求1所述的一种多声源融合场景的人声检测方法,其特征在于,还包括:
根据各个所述语音帧信号的人声检测结果,确定第一语音帧信号,其中,所述第一语音帧信号为检测出人声的语音帧信号;
基于各个所述第一语音帧信号在所述多声源声音信号中对应的时间段,对所述多声源声音信号中的非第一语音帧信号对应的时间段进行滤波,得到第一声音信号;
分别对所述第一声音信号进行去噪处理和人声增强处理,再从处理后的所述第一声音信号中提取人声数据。
5.根据权利要求1所述的一种多声源融合场景的人声检测方法,其特征在于,所述循环神经网络单元具体为LSTM神经网络单元。
6.一种多声源融合场景的人声检测装置,其特征在于,包括:
语音样本获取单元,用于获取第一语音帧样本和第二语音帧样本,其中,所述第一语音帧样本为包含人声的多声源语音帧样本,所述第二语音帧样本为不包含人声的多声源语音帧的语谱图;
语音样本处理单元,用于提取所述第一语音帧样本和所述第二语音帧样本的MFCC特征,再基于所述MFCC特征生成对应的语谱图;
第一训练单元,用于利用所述第一语音帧样本和所述第二语音帧样本,对深度学习网络单元进行人声MFCC特征识别训练;
第二训练单元,用于利用所述深度学习网络单元输出的人声MFCC特征,对循环神经网络单元进行人声检测训练;
人声检测模型构建单元,用于基于训练完成后的深度学习网络单元与循环神经网络单元,构建人声检测模型;
待检测信号获取单元,用于获取待检测的多声源声音信号;
分帧处理单元,用于对所述多声源声音信号进行加窗分帧处理,得到若干个语音帧信号;
语谱图生成单元,用于提取所述语音帧信号的MFCC特征,再基于所述MFCC特征生成所述语音帧信号的语谱图;
人声检测运算单元,用于以所述语谱图作为所述人声检测模型的输入量,以通过所述人声检测模型的运算,获得所述多声源声音信号的人声检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210088372.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纯化阔叶木制浆预水解液中糖分的方法
- 下一篇:矿用钻杆





