[发明专利]基于音频的手势识别方法、装置、终端设备和存储介质在审
申请号: | 202010505950.5 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111860130A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 张进;马鸿 | 申请(专利权)人: | 南方科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;H04L25/02 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 罗琳丽 |
地址: | 518055 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 手势 识别 方法 装置 终端设备 存储 介质 | ||
本申请适用于人机交互技术领域,提供了一种基于音频的手势识别方法、装置、终端设备和存储介质。所述基于音频的手势识别方法包括:获取目标音频信号,所述目标音频信号为预设的原始音频信号在调制后,传播经过用户做出的目标手势后接收到的音频信号;基于所述原始音频信号和所述目标音频信号进行信道估计,得到信道估计的特征数据;对所述信道估计的特征数据进行识别,得到所述目标手势的识别结果。本申请通过信道估计对原始音频信号和目标音频信号进行目标手势的特征数据提取,获得精确的信道估计的特征数据,以提高手势识别结果的准确率。
技术领域
本申请属于人机交互技术领域,尤其涉及一种基于音频的手势识别方法、装置、终端设备和存储介质。
背景技术
随着智能设备的普及,智能设备所配备的传感器也越来越多,这使得利用现有的商业设备中内嵌的传感器进行手势识别变得越来越方便。
现有的基于音频的手势识别方法,通常是基于连续波的多普勒效应进行手势识别。采用这种方式虽然能克服基于视觉、可穿戴设备的惯性传感器进行手势识别所带来的使用场景受限问题,但由于采用的连续波信号的分辨率较低,导致手势识别的准确率较低。
发明内容
有鉴于此,本申请实施例提供了一种基于音频的手势识别方法、装置、终端设备和存储介质,通过信道估计对原始音频信号和目标音频信号进行目标手势的特征数据提取,获得精确的信道估计的特征数据,以提高手势识别结果的准确率。
第一方面,本申请实施例提供了一种基于音频的手势识别方法,包括:
获取目标音频信号,所述目标音频信号为预设的原始音频信号在调制后,传播经过用户做出的目标手势后接收到的音频信号;
基于所述原始音频信号和所述目标音频信号进行信道估计,得到信道估计的特征数据;
对所述信道估计的特征数据进行识别,得到所述目标手势的识别结果。
本申请实施例对调制后原始音频进行播放,通过用户做出手势,获取包含手势特征的目标音频信号,通过原始音频信号和目标音频信号进行信道估计,得到精确的信道估计的特征数据,将获得的所述信道估计的特征数据进行识别,输出准确的目标手势识别结果。
进一步地,所述原始音频信号为周期信号,所述基于所述原始音频信号和所述目标音频信号进行信道估计,得到信道估计的特征数据包括:
对所述目标音频信号进行解调处理,得到目标基频信号;
对所述目标基频信号进行分段,得到多个目标信号片段,每个所述目标信号片段的长度均和所述原始音频信号的周期相同;
对于每个所述目标信号片段,均分别与所述原始音频信号中一个周期的信号片段进行信道估计,得到各自的信道特征数据;
将各个所述目标信号片段的信道特征数据整合,得到所述信道估计的特征数据。
通过将目标音信信号做解调、按周期分段获得目标信号片段,然后利用原始音频信号中的一个周期的信号片段分别与每个目标信号片段进行信道估计得到各自的信道特征数据,最后将各个信道特征数据合并,即可获得更为准确的信道估计的特征数据,从而提高手势识别的准确率。
进一步的,所述对所述目标音频信号进行解调处理,得到目标基频信号包括:
对所述目标音频信号进行降载波和IQ分解,得到降载波信号的实部信号和虚部信号;
使用低通滤波器对所述降载波信号的实部信号和虚部信号去噪,得到所述目标基频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505950.5/2.html,转载请声明来源钻瓜专利网。