[发明专利]一种基于飞机音频的机型智能识别方法有效

申请号：	202010657182.5	申请日：	2020-07-09
公开（公告）号：	CN111816205B	公开（公告）日：	2023-06-20
发明（设计）人：	王卫杰;叶瑞达;任元;何亮;余昊元;樊亚洪;张克明;张贤炜	申请（专利权）人：	中国人民解放军战略支援部队航天工程大学
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/24
代理公司：	北京中政联科专利代理事务所(普通合伙) 11489	代理人：	张春慧
地址：	101416***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于飞机音频机型智能识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于飞机音频的机型智能识别方法，其特征在于，包括：采集不同型号飞机的音频，将音频进行预处理，提取音频的梅尔倒谱系数特征，训练残差自注意力模型；将目标飞机音频信号输入到训练好的模型中，得到目标飞机的型号，该方法的步骤包括如下；

(1)采集不同型号飞机的音频及预处理：

飞机起飞降落时，通过机场噪音监测系统采集不同型号飞机的噪声；飞机空中飞行时，通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声；通过不同方法采集的飞机音频提高识别模型的鲁棒性；飞机音频的预处理，飞机空中飞行时的噪声可能存在人声，剔除人声；同一机型的飞机记录标签，将所有音频切割为5s的音频片段；对不同类型的飞机音频进行等数量随机选取，并按照7:2:1的比例随机分为训练集，验证集和测试集；

(2)提取音频的梅尔倒谱系数特征；

将音频信号频率转化为梅尔频率：

其中f_mel是梅尔频率，f是音频信号频率；梅尔频率取对数得到对数梅尔声谱，进行离散余弦变化，保留第2个到第13个系数，得到12维的梅尔倒谱系数特征；

(3)训练残差自注意力模型：

(3a)训练流程：

将梅尔倒谱系数特征输入至嵌入层进行降维，位置编码器对特征进行位置编码得到特征X₁，特征X₁与三个权重矩阵相乘得到Q,K,V：

W^q、W^k、W^v分别由查询向量q、键向量k、值向量v组成的权重矩阵；Q,K,V进行两步计算，算法1：

算法2：

X₂＝Matmul·V (4)

得到特征X₂，与特征X₁特征相加得到特征X，使用残差网络结构减轻网络的退化程度；将特征X输入池化层，减少网络参数，防止过拟合；最后通过全连接层输出，得到识别模型，全连接层中神经元的个数等于飞机型号类别总数；

(3b)参数设置：

将飞机训练集和验证集输入到残差自注意力模型中，网络学习率learning_rate设置为0.0001，选用交叉熵损失函数，利用梯度下降法迭代训练网络，直至损失函数收敛，得到基于飞机音频的机型智能识别模型；