[发明专利]基于音频的手势识别方法、装置、终端设备和存储介质在审
| 申请号: | 202010505950.5 | 申请日: | 2020-06-05 |
| 公开(公告)号: | CN111860130A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 张进;马鸿 | 申请(专利权)人: | 南方科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;H04L25/02 |
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 罗琳丽 |
| 地址: | 518055 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 音频 手势 识别 方法 装置 终端设备 存储 介质 | ||
1.一种基于音频的手势识别方法,其特征在于,包括:
获取目标音频信号,所述目标音频信号为预设的原始音频信号在调制后,传播经过用户做出的目标手势后接收到的音频信号;
基于所述原始音频信号和所述目标音频信号进行信道估计,得到信道估计的特征数据;
对所述信道估计的特征数据进行识别,得到所述目标手势的识别结果。
2.如权利要求1所述的手势识别方法,其特征在于,所述原始音频信号为周期信号,所述基于所述原始音频信号和所述目标音频信号进行信道估计,得到信道估计的特征数据包括:
对所述目标音频信号进行解调处理,得到目标基频信号;
对所述目标基频信号进行分段,得到多个目标信号片段,每个所述目标信号片段的长度均和所述原始音频信号的周期相同;
对于每个所述目标信号片段,均分别与所述原始音频信号中一个周期的信号片段进行信道估计,得到各自的信道特征数据;
将各个所述目标信号片段的信道特征数据整合,得到所述信道估计的特征数据。
3.如权利要求2所述的手势识别方法,其特征在于,所述对所述目标音频信号进行解调处理,得到目标基频信号包括:
对所述目标音频信号进行降载波和IQ分解,得到降载波信号的实部信号和虚部信号;
使用低通滤波器对所述降载波信号的实部信号和虚部信号去噪,得到所述目标基频信号。
4.如权利要求2所述的手势识别方法,其特征在于,每个所述目标信号片段均带有时间戳,所述将各个所述目标信号片段的信道特征数据整合,得到所述信道估计的特征数据包括:
将各个所述目标信号片段的信道特征数据分别表示为向量的形式,得到各个所述目标信号片段的特征向量;
将各个所述目标信号片段的特征向量按照各自对应的时间戳大小进行排列,构成特征矩阵;
对于所述特征矩阵中的每一列,均将各自包含的各个元素值分别减去前一列包含的各个对应元素值,得到静态消除后的所述特征矩阵;
将静态消除后的所述特征矩阵确定为所述信道估计的特征数据。
5.如权利要求1所述的手势识别方法,其特征在于,所述对所述信道估计的特征数据进行识别,得到所述目标手势的识别结果包括:
采用预先构建的域自适应神经网络模型对所述信道估计的特征数据进行识别,得到所述目标手势的识别结果;
其中,所述域自适应神经网络模型通过以下步骤构建:
获取第一训练数据集和第二训练数据集,所述第一训练数据集包含多组已分配域标签和手势标签的信道估计样本数据,所述第二训练数据集包含多组已分配域标签但未分配手势标签的信道估计样本数据;
以所述第一训练数据集和所述第二训练数据集作为训练集,训练得到所述域自适应神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010505950.5/1.html,转载请声明来源钻瓜专利网。





