[发明专利]一种行为识别方法及装置有效
申请号: | 202010060754.1 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111227839B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 王迎雪;刘弋锋;邹博超;谢海永 | 申请(专利权)人: | 中国电子科技集团公司电子科学研究院 |
主分类号: | A61B5/11 | 分类号: | A61B5/11;A61B5/00;G01S15/58;G06F18/10;G06F18/213;G06F18/24;G06N3/0442;G06N3/0464;G06N3/084 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 于金平 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行为 识别 方法 装置 | ||
1.一种行为识别方法,其特征在于,包括:
控制声波发射器发射声波信号;
采集目标对所述声波信号的反射信号;
基于所述反射信号利用预设深度神经网络模型确定与所述反射信号对应的行为类型,其中,所述预设深度神经网络模型根据声波反射信号样本训练得到,所述声波反射信号样本至少包括所述目标执行两种类型的行为对所述声波信号产生的反射信号;
其中,所述预设深度神经网络模型的训练过程,包括:
定义目标函数:
其中,f(·)为系统函数,x为训练样本,s为LSTM的训练样本,θ1为CNN网络中的参数集合,θ2为LSTM网络中的参数集合,为损失函数,整个系统的目标是寻找一组合适的θ1和θ2,使得最小;
将分为和两个部分,其中,表示CNN网络的损失函数,表示LSTM网络的损失函数,定义如下:
其中,K表示LSTM网络中所使用的总的阶段数,k表示在使用逐层多目标方式优化LSTM网络时的第k个阶段,则表示LSTM网络中第k个阶段的损失函数;中的两个部分都采用交叉熵进行计算,具体包括:
其中,n表示一次迭代中训练所使用的总的声学帧数,y(i)表示第i帧的实际值(标签),x(i)则表示CNN网络的输出;
其中,rj表示在第k阶段第j帧信号的参考值,(sj)k表示在第k阶段第j帧信号对应的LSTM的网络输出。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在采集所述反射信号之后,对所述反射信号进行调制以及低通滤波;
利用端点检测算法去除进行调制以及低通滤波后的信号的静音部分;
通过预加重因子对去除静音部分后的信号进行预加重处理;
对预加重处理后的信号进行分帧处理以及加窗处理。
3.根据权利要求2所述的方法,其特征在于,所述基于所述反射信号利用预设深度神经网络模型确定与所述反射信号对应的行为类型,包括:
获取进行分帧以及加窗处理后的信号的时序声学特征向量梅尔频谱;
将所述梅尔频谱作为所述预设深度神经网络模型的输入,得到与所述反射信号对应的行为类型。
4.根据权利要求1所述的方法,其特征在于,所述预设深度神经网络模型包括多层卷积深度神经网络、线性层、多层长短时记忆网络以及全连接层,所述多层卷积深度神经网络的输入与一层线性层相连,所述一层线性层与所述多层长短时记忆网络相连,所述多层长短时记忆网络的输出与所述全连接层相连。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述行为类型包括以下至少一种:
慢走、慢跑、正常行走、上跳、快速奔跑以及跌倒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司电子科学研究院,未经中国电子科技集团公司电子科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010060754.1/1.html,转载请声明来源钻瓜专利网。