[发明专利]一种目标识别方法、装置、存储介质及电子设备在审
申请号: | 202011077729.0 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112233694A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 滕腾;马元锋;吴志成;范红波;张园;邢彦梅 | 申请(专利权)人: | 中国电子科技集团公司第三研究所 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G06F17/14;G06K9/62 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 识别 方法 装置 存储 介质 电子设备 | ||
1.一种目标识别方法,其特征在于,该方法的步骤包括:
对获取的声音数据进行处理,获得该声音数据的声纹特征;
基于第一分类模型对所述声纹特征进行特征识别,判断所述声音数据是否为噪声;
若所述声音数据不是噪声,则基于多个不同的第二分类模型依次对所述声纹特征进行特征识别,输出一组或多组识别结果;
其中,所述第一分类模型和所述第二分类模型皆为二分类的分类模型,所述二分类的分类模型通过正则化线性分类器建立。
2.根据权利要求1所述的目标识别方法,其特征在于,所述第一分类模型和/或第二分类模型的训练步骤如下:
对获取的声音数据进行分帧,并计算各帧数据的快速傅里叶变换,获得所述声音数据的原始分类特征;
基于Wilcoxon秩和检验及顺序浮动后向搜索算法对所述原始分类特征进行两级优化,获得最优分类特征,并基于所述最优分类特征训练分类模型。
3.根据权利要求2所述的目标识别方法,其特征在于,所述基于Wilcoxon秩和检验及顺序浮动后向搜索算法对所述原始分类特征进行两级优化,获得最优分类特征,并基于所述最优分类特征训练分类模型进一步包括:
通过Wilcoxon秩和检验对所述原始分类特征进行初级优化,排除在类别差异中不显著的特征,获得初级优化分类特征;
采用顺序浮动后向搜索算法在所述初级优化分类特征中搜寻最优分类特征,获得最优分类特征,基于所述最优分类特征训练分类模型。
4.根据权利要求2所述的目标识别方法,其特征在于,获取的声音数据包括用于训练第一分类模型所采集的全部待识别的目标声音数据及没有目标存在时的环境声音数据;和用于训练第二分类模型所采集的全部待识别的目标中任意两种目标的声音数据。
5.根据权利要求1所述的目标识别方法,其特征在于,该方法进一步包括基于所述第一分类模型和所述第二分类模型建立三层有向无环分类模型,将第一分类模型作为顶层分类节点,将多个第二分类模型中训练准确率最高的分类模型作为第二层分类节点,其余第二分类模型作为第三层分类节点。
6.一种目标识别装置,其特征在于,该装置包括:
识别单元,用于对获取的声音数据进行处理,获得该声音数据的声纹特征;
基于第一分类模型对所述声纹特征进行特征识别,判断所述声音数据是否为噪声;
所述声音数据不是噪声,则基于多个不同的第二分类模型依次对所述声纹特征进行特征识别,输出一组或多组识别结果;
其中,所述第一分类模型和所述第二分类模型皆为二分类的分类模型,所述二分类的分类模型通过正则化线性分类器建立。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
8.一种电子设备,其特征在于,包括:存储器,一个或多个处理器;存储器与处理器通过通信总线相连;处理器被配置为执行存储器中的指令;所述存储器中存储有用于执行如权利要求1至5任一项所述方法中各个步骤的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三研究所,未经中国电子科技集团公司第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011077729.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于误码率的色散估计方法及装置
- 下一篇:检测氯乙烯单体中金属离子含量的方法