[发明专利]动作识别、驾驶动作分析方法和装置及电子设备在审
| 申请号: | 201811130798.6 | 申请日: | 2018-09-27 |
| 公开(公告)号: | CN110956060A | 公开(公告)日: | 2020-04-03 |
| 发明(设计)人: | 陈彦杰;王飞;钱晨 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 动作 识别 驾驶 分析 方法 装置 电子设备 | ||
1.一种动作识别方法,其特征在于,包括:
提取包括有人脸的图像的特征;
基于所述特征提取可能包括预定动作的多个候选框;
基于多个所述候选框确定动作目标框,其中,所述动作目标框包括人脸的局部区域和动作交互物;
基于所述动作目标框进行预定动作的分类,获得动作识别结果。
2.根据权利要求1所述的方法,其特征在于,所述人脸局部区域,包括以下至少之一:嘴部区域,耳部区域,眼部区域。
3.根据权利要求1或2任一项所述的方法,其特征在于,所述提取包括有人脸的图像的特征,包括:
经神经网络的特征提取分支提取包括有人脸的图像的特征,获得特征图。
4.根据权利要求3所述的方法,其特征在于,所述基于所述特征提取可能包括预定动作的多个候选框,包括:
经所述神经网络的候选框提取分支在所述特征图上提取可能包括预定动作的多个候选框。
5.根据权利要求4所述的方法,其特征在于,所述经所述神经网络的候选框提取分支在所述特征图上提取可能包括预定动作的多个候选框,包括:
根据所述预定动作的特征对所述特征图中的特征进行划分,获得多个候选区域;
根据所述多个候选区域,获得所述多个候选框和所述多个候选框的第一置信度,其中,所述第一置信度为所述候选框为所述动作目标框的概率。
6.一种驾驶动作分析方法,其特征在于,包括:
经车载摄像头采集包括有驾驶员人脸图像的视频流;
通过如权利要求1至5任一所述的动作识别方法,获取所述视频流中至少一帧图像的动作识别结果;
响应于动作识别结果满足预定条件,生成分心或危险驾驶提示信息。
7.一种动作识别装置,其特征在于,包括:
第一提取单元,用于提取包括有人脸的图像的特征;
第二提取单元,用于基于所述特征提取可能包括预定动作的多个候选框;
确定单元,用于基于多个所述候选框确定动作目标框,其中,所述动作目标框包括人脸的局部区域和动作交互物;
分类单元,用于基于所述动作目标框进行预定动作的分类,获得动作识别结果。
8.一种驾驶动作分析装置,其特征在于,包括:
车载摄像头,用于采集包括有驾驶员人脸图像的视频流;
第一获取单元,用于通过如权利要求7所述的动作识别装置,获取所述视频流中至少一帧图像的动作识别结果;
生成单元,用于响应于动作识别结果满足预定条件,生成分心或危险驾驶提示信息。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时实现权利要求1至5任一项所述的方法,或者权利要求6所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现权利要求1至5任一项所述的方法,或者权利要求6所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811130798.6/1.html,转载请声明来源钻瓜专利网。





