[发明专利]声音识别方法、交互方法、声音识别系统、计算机可读存储介质及可移动平台在审
| 申请号: | 201980009292.6 | 申请日: | 2019-05-15 |
| 公开(公告)号: | CN111684522A | 公开(公告)日: | 2020-09-18 |
| 发明(设计)人: | 吴俊峰;赵文泉;李皓宇;周事成;吴晟 | 申请(专利权)人: | 深圳市大疆创新科技有限公司 |
| 主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 艾佳 |
| 地址: | 518057 广东省深圳市南山区高*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 识别 方法 交互 系统 计算机 可读 存储 介质 移动 平台 | ||
1.一种声音识别方法,用于识别拍击声音,其特征在于,所述声音识别方法包括:
获取待识别声音信号的至少一个声音片段和所述声音片段的第一特征信息,所述第一特征信息为所述声音片段的能量值,若所述声音片段的中部区域的能量值大于能量阈值,则从所述声音片段中提取第二特征信息;及
根据至少一个所述声音片段的所述第二特征信息,识别所述待识别声音信号是否包括拍击声音。
2.根据权利要求1所述的声音识别方法,其特征在于,所述若所述声音片段的中部区域的能量值大于能量阈值,则从所述声音片段中提取第二特征信息,包括:
对所述待识别声音信号进行分帧加窗处理,得到所述待识别声音信号对应的多个声音帧;
若所述声音片段对应的多个所述声音帧的中部区域的声音帧的所述能量值大于所述能量阈值,则从所述声音片段中提取所述第二特征信息。
3.根据权利要求2所述的声音识别方法,其特征在于,所述能量值包括所述声音帧的频谱值,所述若所述声音片段对应的多个所述声音帧的中部区域的声音帧的所述能量值大于所述能量阈值,则从所述声音片段中提取所述第二特征信息,包括:
对多个所述声音帧进行快速傅里叶变换,获得多个所述声音帧的频谱值;
若所述声音片段对应的多个所述声音帧的中部区域的声音帧的所述频谱值大于所述能量阈值,则从所述声音片段中提取所述第二特征信息。
4.根据权利要求3所述的声音识别方法,其特征在于,所述窗口能够在多个所述声音帧之间顺次滑动,所述若所述声音片段对应的多个所述声音帧的中部区域的声音帧的所述频谱值大于所述能量阈值,则从所述声音片段中提取所述第二特征信息,包括:
若所述窗口的中部区域的声音帧的频谱值大于能量阈值,产生触发信号;
当所述窗口顺次滑动过若干个所述声音帧时,若连续产生的触发信号的数目达到触发数目阈值,则从声音片段中提取第二特征信息。
5.根据权利要求3所述的声音识别方法,其特征在于,所述窗口能够在多个所述声音帧之间顺次滑动,所述若所述声音片段对应的多个所述声音帧的中部区域的声音帧的所述频谱值大于所述能量阈值,则从所述声音片段中提取所述第二特征信息,包括:
当所述窗口的中部区域的声音帧的频谱值大于第一能量值,所述窗口的两端区域的声音帧的频谱值小于第二能量值时,产生触发信号,其中,所述第一能量值大于第二能量值;
当所述窗口顺次滑动过若干个所述声音帧时,若连续产生的所述触发信号的数目达到触发数目阈值,则从所述声音片段中提取所述第二特征信息。
6.根据权利要求1所述的声音识别方法,其特征在于,所述根据至少一个所述声音片段的所述第二特征信息,识别所述待识别声音信号是否包括拍击声音,包括:
将所述第二特征信息输入识别模型中进行识别,以识别所述待识别声音信号是否包括拍击声音。
7.根据权利要求6所述的声音识别方法,其特征在于,所述第二特征信息包括声学特征,所述声学特征包括梅尔频率倒谱系数特征、线性预测系数特征、Filterbank特征、瓶颈特征中的至少一种。
8.根据权利要求6所述的声音识别方法,其特征在于,所述识别模型包括多种声音类别,所述将所述第二特征信息输入识别模型中进行识别,以识别所述待识别声音信号是否包括拍击声音,包括:
分别确定所述第二特征信息与多种所述声音类别的特征信息的似然度;
对所述似然度进行排序,将所述似然度最高的声音类别确定为所述声音片段的类别,以识别所述待识别声音信号是否包括拍击声音。
9.根据权利要求8所述的声音识别方法,其特征在于,所述声音类别包括拍击声音类别和非拍击声音类别。
10.根据权利要求9所述的声音识别方法,其特征在于,所述拍击声音类别包括至少两种表示不同连续拍击次数的拍击声音类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大疆创新科技有限公司,未经深圳市大疆创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980009292.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:天线装置及具有其的图传设备
- 下一篇:表达嵌合抗原受体的调节性T细胞





