[发明专利]注视区域检测及神经网络的训练方法、装置和设备在审
申请号: | 201910204566.9 | 申请日: | 2019-03-18 |
公开(公告)号: | CN111723596A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 黄诗尧;王飞;钱晨 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注视 区域 检测 神经网络 训练 方法 装置 设备 | ||
本说明书实施例提供一种注视区域检测及神经网络的训练方法、装置和设备,其中,注视区域检测用神经网络的训练方法包括:至少将作为训练样本的人脸图像输入神经网络,其中,所述人脸图像包括有所述人脸图像中的人脸所对应的注视区域类别标注信息,标注的注视区域类别属于预先对指定空间区域划分得到的多类定义注视区域之一;经所述神经网络对输入的所述人脸图像进行特征提取,并根据提取的特征确定所述人脸图像的注视区域类别预测信息;确定获取的注视区域类别预测信息与相应图像的注视区域类别标注信息之间的差异;基于所述差异调整所述神经网络的网络参数。
技术领域
本公开涉及计算机视觉技术,特别涉及一种注视区域检测及神经网络的训练方法、装置和设备。
背景技术
随着人工智能和汽车行业的迅速发展,将人工智能技术应用到量产车辆上已经成为一个最具市场前景的方向。目前,车辆市场需求量较为急迫的人工智能产品中,其中一个产品就是用于监控驾驶员在驾驶时的驾驶状态,例如,驾驶员是否存在分心,以在分心时及时的对驾驶员进行提醒,降低事故风险。
发明内容
有鉴于此,本说明书一个或多个实施例的目的,即提供一种注视区域检测及神经网络的训练方法、装置和设备。
第一方面,提供一种注视区域检测用神经网络的训练方法,所述方法包括:
至少将作为训练样本的人脸图像输入神经网络,其中,所述人脸图像包括有所述人脸图像中的人脸所对应的注视区域类别标注信息,标注的注视区域类别属于预先对指定空间区域划分得到的多类定义注视区域之一;
经所述神经网络对输入的所述人脸图像进行特征提取,并根据提取的特征确定所述人脸图像的注视区域类别预测信息;
确定获取的注视区域类别预测信息与相应图像的注视区域类别标注信息之间的差异;
基于所述差异调整所述神经网络的网络参数。
结合本公开提供的任一实施方式,所述至少将作为训练样本的人脸图像输入神经网络之前,所述方法还包括:裁剪所述人脸图像中的至少一眼睛区域,得到至少一眼睛图像;所述至少将作为训练样本的人脸图像输入神经网络,包括:将所述人脸图像和所述人脸图像的所述至少一眼睛图像同时输入所述神经网络。
结合本公开提供的任一实施方式,所述将所述人脸图像和所述人脸图像的所述至少一眼睛图像同时输入所述神经网络,包括:将所述人脸图像和所述人脸图像的所述至少一眼睛图像中的各图像调整到相同的预定尺寸;将调整尺寸后的各图像同时输入所述神经网络;所述经所述神经网络对输入的所述人脸图像进行特征提取,并根据提取的特征确定所述人脸图像的注视区域类别预测信息,包括:经所述神经网络同时提取输入的所述各图像的特征;根据提取的特征确定所述人脸图像的注视区域类别预测信息。
结合本公开提供的任一实施方式,所述将所述人脸图像和所述人脸图像的所述至少一眼睛图像同时输入所述神经网络,包括:将所述人脸图像和所述至少一眼睛图像对应输入所述神经网络包括的不同的特征提取分支,其中,输入到所述神经网络中的人脸图像和眼睛图像的尺寸不同;所述经所述神经网络对输入的所述人脸图像进行特征提取,并根据提取的特征确定所述人脸图像的注视区域类别预测信息,包括:经各所述特征提取分支分别提取输入各特征提取分支的人脸图像或眼睛图像的特征;融合各特征提取分支提取的人脸图像的特征和眼睛图像的特征,得到融合特征;根据所述融合特征确定所述人脸图像的注视区域类别预测信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910204566.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:商品识别、数据处理方法及设备
- 下一篇:车型推荐方法、终端设备及存储介质