[发明专利]多姿态人体检测方法、计算机存储介质及电子设备有效
| 申请号: | 201911056495.9 | 申请日: | 2019-10-31 |
| 公开(公告)号: | CN111079519B | 公开(公告)日: | 2023-08-29 |
| 发明(设计)人: | 朱勋沐;毛亮;林焕凯;周谦;侯玉清 | 申请(专利权)人: | 高新兴科技集团股份有限公司 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 广州国鹏知识产权代理事务所(普通合伙) 44511 | 代理人: | 宁尚国;葛红 |
| 地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多姿 人体 检测 方法 计算机 存储 介质 电子设备 | ||
1.一种执法办案区场景下的多姿态人体检测方法,其特征在于,包括以下步骤:
S1、在RefineDet的ARM分支中加入FSAF模块,构成FSAF-RefineDet网络结构;
S2、采集执法办案区场景下的人体图像数据,进行人体信息标注,并将人体信息标注后的所述人体图像数据划分为训练集和测试集;
S3、对所述训练集进行旋转扩增;
S4、对旋转扩增后的训练数据尺度归一化后进行随机增强和随机添加噪声;
S5、对所述FSAF-RefineDet网络进行训练,得到训练模型;
S6、将所述训练模型在所述测试集上进行测试,选择识别精度最高的训练模型作为最终检测模型;
在步骤S1中,所述RefineDet的主干网络为VGG16的全卷积结构,所述主干网络包括17个卷积层,其中,Conv4_3、Conv5_3、fc7和Conv6_2输出的特征作为ARM分支和ODM的特征金字塔分支的特征输入;
步骤S1包括:
S11、对Conv4_3、Conv5_3、fc7和Conv6_2分别接上一个核为3*3,输出通道为2的卷积层,并接上Focal Loss,以用于预测每一个空间位置2个目标类别的概率;
S12、对Conv4_3、Conv5_3、fc7和Conv6_2分别接上一个核为3*3,输出通道为4的卷积层,并接上IOU Loss,以用于预测目标外包围框。
2.根据权利要求1所述的方法,其特征在于,步骤S2包括:
S21、对执法办案区场景下不同人体姿态、不同视角和不同图像清晰度的数据进行采集;
S22、对采集到的数据进行人体信息标注,获得人体的外包围框;
S23、将人体信息标注后的所述人体图像数据划分为所述训练集和所述测试集。
3.根据权利要求1所述的方法,其特征在于,步骤S3包括:对所述训练集进行顺时针的90度,180度和270度旋转扩增。
4.根据权利要求1所述的方法,其特征在于,步骤S4包括:
S41、对旋转扩增后的训练数据的尺度归一化为320*320;
S42、以0.5的概率对原图随机进行亮度、对比度、色调和饱和度的增强;
S43、以0.2的概率对原图随机添加高斯模糊和椒盐噪声。
5.根据权利要求1所述的方法,其特征在于,步骤S5包括:
S51、根据步骤S4获得的数据,使用深度学习方法训练所述FSAF-RefineDet网络;
S52、每隔预定迭代次数保存一个训练模型。
6.根据权利要求1所述的方法,其特征在于,步骤S6包括:
S61、对步骤S5中训练输出的所有训练模型在所述测试集上进行测试,统计固定阈值为0.9的准确率和召回率;
S62、对比步骤S61的测试结果,选择识别精度最高的训练模型作为最终检测模型。
7.一种计算机存储介质,其特征在于,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如权利要求1-6中任一项所述的方法。
8.一种电子设备,包括存储器和处理器,其特征在于,
所述存储器用于存储一条或多条计算机指令;
所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司,未经高新兴科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056495.9/1.html,转载请声明来源钻瓜专利网。





