[发明专利]一种基于二值化卷积神经网络的行人检测方法在审
申请号: | 201810043902.1 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108304786A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 陆生礼;杨海平;庞伟;戎海龙;韩志;李硕 | 申请(专利权)人: | 东南大学;东南大学—无锡集成电路技术研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/38;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 熊玉玮 |
地址: | 214135 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 二值化 卷积神经网络 卷积 数组 整型 内存 嵌入式系统 卷积核组 卷积计算 权重参数 数据计算 电数字 计算量 位操作 推算 占用 转换 应用 访问 | ||
1.一种基于二值化卷积神经网络的行人检测方法,其特征在于,
采用训练图像训练二值化卷积神经网络,所述二值化卷积神经网络从各卷积层的二值化输入数据中提取图像特征后计算损失函数值,由BP算法更新全精度权重参数,将全精度权重参数转换为二值化权重参数,对最后一层卷积层输出的所有预测框进行初步筛选;
采用训练好的二值化卷积神经网络初步筛选待检测图像中的预测框;
采用非极大拟制算法对二值化卷积神经网络初步筛选的预测框进行进一步的筛选以确定包含行人的预测框,显示包含行人的预测框。
2.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,采用训练好的二值化卷积神经网络初步筛选待检测图像中的预测框的过程中:按照相同的顺序将每个卷积层每个卷积核组的二值化权重参数以及该卷积层的二值化输入数据拼接为两个无符号整型数组,每个卷积层对表示其每个卷积核组二值化权重参数的无符号整型数组以及表示其二值化输入数据的无符号整型数组先进行同或位操作后进行BITCOUNT操作得到该卷积层的卷积结果,对每个卷积层的卷积结果进行批量归一化操作和激活操作后输出各卷积层提取的图像特征。
3.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,对最后一层卷积层输出的所有预测框进行初步筛选的方法为:从最后一层卷积层输出的所有预测框中选择检测到行人的概率大于设定阈值的预测框,所述检测到行人的概率为预测框中含有目标的概率与该目标是行人的概率之积。
4.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,最后一层卷积层输出的预测框在以最后一层卷积层输出的左上角预测框为零点的坐标系中表示为:x=Cx+σ(tx),y=Cy+σ(ty),(x,y)为预测框中心坐标(tx,ty)在以最后一层卷积层输出的左上角预测框为零点的坐标系中的坐标,(Cx,Cy)为预测框中心所在的特征图单元的坐标,bw、bh分别为最后一层卷积层输出的左上角预测框为零点的坐标系中的宽度和高度,pw、ph分别为预设框宽和框高。
5.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,采用非极大拟制算法对二值化卷积神经网络初步筛选的预测框进行进一步的筛选的方法为:对二值化卷积神经网络初步筛选的预测框检测到行人的概率按照从大到小的顺序排列,删除与检测到行人的概率最大的预测框的交叠率大于50%的预测框,删除与检测到行人的概率次大的预测框的交叠率大于50%的预测框,以此类推,最后留下的预测框即为非极大拟制算法进一步筛选的预测框。
6.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,所述二值化卷积神经网络包括:
多个二值化卷积层,对训练图像进行多深度多层卷积以提取图像特征,
下采样层,采用设定尺寸的核按照设定的步长对各二值化卷积层的输出进行局部最大值采样,及,
检测层,对最后一层卷积层输出的所有预测框进行初步筛选。
7.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,所述训练图像和待检测图像通过对采集的图片或视频帧进行插值采样获取。
8.根据权利要求2所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,每个卷积层每个卷积核组的二值化权重参数通过如下方法获取:以每个卷积层每个卷积核组的全精度权重参数的L1范数与权重参数个数的商分别作为每个卷积层每个卷积核组的权重参数,在每个卷积层各卷积核组的权重参数大于或等于0时将其二值化为1,在每个卷积层各卷积核组的权重参数小于0时将其二值化为-1,将1和-1分别映射为1和0。
9.根据权利要求2所述一种基于二值化卷积神经网络的行人检测方法,其特征在于,二值化输入数据的获取方法为:在输入数据大于0时将其二值化为1,在输入数据小于或等于0时将其二值化为-1,将1和-1分别映射为1和0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;东南大学—无锡集成电路技术研究所,未经东南大学;东南大学—无锡集成电路技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810043902.1/1.html,转载请声明来源钻瓜专利网。