[发明专利]一种基于飞机音频的机型智能识别方法有效
申请号: | 202010657182.5 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111816205B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王卫杰;叶瑞达;任元;何亮;余昊元;樊亚洪;张克明;张贤炜 | 申请(专利权)人: | 中国人民解放军战略支援部队航天工程大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/24 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 张春慧 |
地址: | 101416*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 飞机 音频 机型 智能 识别 方法 | ||
1.一种基于飞机音频的机型智能识别方法,其特征在于,包括:采集不同型号飞机的音频,将音频进行预处理,提取音频的梅尔倒谱系数特征,训练残差自注意力模型;将目标飞机音频信号输入到训练好的模型中,得到目标飞机的型号,该方法的步骤包括如下;
(1)采集不同型号飞机的音频及预处理:
飞机起飞降落时,通过机场噪音监测系统采集不同型号飞机的噪声;飞机空中飞行时,通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声;通过不同方法采集的飞机音频提高识别模型的鲁棒性;飞机音频的预处理,飞机空中飞行时的噪声可能存在人声,剔除人声;同一机型的飞机记录标签,将所有音频切割为5s的音频片段;对不同类型的飞机音频进行等数量随机选取,并按照7:2:1的比例随机分为训练集,验证集和测试集;
(2)提取音频的梅尔倒谱系数特征;
将音频信号频率转化为梅尔频率:
其中fmel是梅尔频率,f是音频信号频率;梅尔频率取对数得到对数梅尔声谱,进行离散余弦变化,保留第2个到第13个系数,得到12维的梅尔倒谱系数特征;
(3)训练残差自注意力模型:
(3a)训练流程:
将梅尔倒谱系数特征输入至嵌入层进行降维,位置编码器对特征进行位置编码得到特征X1,特征X1与三个权重矩阵相乘得到Q,K,V:
Wq、Wk、Wv分别由查询向量q、键向量k、值向量v组成的权重矩阵;Q,K,V进行两步计算,算法1:
算法2:
X2=Matmul·V (4)
得到特征X2,与特征X1特征相加得到特征X,使用残差网络结构减轻网络的退化程度;将特征X输入池化层,减少网络参数,防止过拟合;最后通过全连接层输出,得到识别模型,全连接层中神经元的个数等于飞机型号类别总数;
(3b)参数设置:
将飞机训练集和验证集输入到残差自注意力模型中,网络学习率learning_rate设置为0.0001,选用交叉熵损失函数,利用梯度下降法迭代训练网络,直至损失函数收敛,得到基于飞机音频的机型智能识别模型;
(4)识别目标机型:
将飞机音频的测试集,按照上述步骤(1)-(3)操作得到音频的梅尔倒谱系数特征,将特征输入到机型智能识别模型中,得到目标机型的识别结果,并通过与正确标签对比,计算型智能识别模型的精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队航天工程大学,未经中国人民解放军战略支援部队航天工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010657182.5/1.html,转载请声明来源钻瓜专利网。