[发明专利]一种基于二值化卷积神经网络的行人检测方法在审

申请号：	201810043902.1	申请日：	2018-01-17
公开（公告）号：	CN108304786A	公开（公告）日：	2018-07-20
发明（设计）人：	陆生礼;杨海平;庞伟;戎海龙;韩志;李硕	申请（专利权）人：	东南大学;东南大学—无锡集成电路技术研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/38;G06N3/04;G06N3/08
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	熊玉玮
地址：	214135 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	行人检测二值化卷积神经网络卷积数组整型内存嵌入式系统卷积核组卷积计算权重参数数据计算电数字计算量位操作推算占用转换应用访问
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于二值化卷积神经网络的行人检测方法，其特征在于，

采用训练图像训练二值化卷积神经网络，所述二值化卷积神经网络从各卷积层的二值化输入数据中提取图像特征后计算损失函数值，由BP算法更新全精度权重参数，将全精度权重参数转换为二值化权重参数，对最后一层卷积层输出的所有预测框进行初步筛选；

采用训练好的二值化卷积神经网络初步筛选待检测图像中的预测框；

采用非极大拟制算法对二值化卷积神经网络初步筛选的预测框进行进一步的筛选以确定包含行人的预测框，显示包含行人的预测框。

2.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，采用训练好的二值化卷积神经网络初步筛选待检测图像中的预测框的过程中：按照相同的顺序将每个卷积层每个卷积核组的二值化权重参数以及该卷积层的二值化输入数据拼接为两个无符号整型数组，每个卷积层对表示其每个卷积核组二值化权重参数的无符号整型数组以及表示其二值化输入数据的无符号整型数组先进行同或位操作后进行BITCOUNT操作得到该卷积层的卷积结果，对每个卷积层的卷积结果进行批量归一化操作和激活操作后输出各卷积层提取的图像特征。

3.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，对最后一层卷积层输出的所有预测框进行初步筛选的方法为：从最后一层卷积层输出的所有预测框中选择检测到行人的概率大于设定阈值的预测框，所述检测到行人的概率为预测框中含有目标的概率与该目标是行人的概率之积。

4.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，最后一层卷积层输出的预测框在以最后一层卷积层输出的左上角预测框为零点的坐标系中表示为：x＝C_x+σ(t_x)，y＝C_y+σ(t_y)，(x,y)为预测框中心坐标(t_x,t_y)在以最后一层卷积层输出的左上角预测框为零点的坐标系中的坐标，(C_x,C_y)为预测框中心所在的特征图单元的坐标，b_w、b_h分别为最后一层卷积层输出的左上角预测框为零点的坐标系中的宽度和高度，p_w、p_h分别为预设框宽和框高。

5.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，采用非极大拟制算法对二值化卷积神经网络初步筛选的预测框进行进一步的筛选的方法为：对二值化卷积神经网络初步筛选的预测框检测到行人的概率按照从大到小的顺序排列，删除与检测到行人的概率最大的预测框的交叠率大于50％的预测框，删除与检测到行人的概率次大的预测框的交叠率大于50％的预测框，以此类推，最后留下的预测框即为非极大拟制算法进一步筛选的预测框。

6.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，所述二值化卷积神经网络包括：

多个二值化卷积层，对训练图像进行多深度多层卷积以提取图像特征，

下采样层，采用设定尺寸的核按照设定的步长对各二值化卷积层的输出进行局部最大值采样，及，

检测层，对最后一层卷积层输出的所有预测框进行初步筛选。

7.根据权利要求1所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，所述训练图像和待检测图像通过对采集的图片或视频帧进行插值采样获取。

8.根据权利要求2所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，每个卷积层每个卷积核组的二值化权重参数通过如下方法获取：以每个卷积层每个卷积核组的全精度权重参数的L1范数与权重参数个数的商分别作为每个卷积层每个卷积核组的权重参数，在每个卷积层各卷积核组的权重参数大于或等于0时将其二值化为1，在每个卷积层各卷积核组的权重参数小于0时将其二值化为-1，将1和-1分别映射为1和0。

9.根据权利要求2所述一种基于二值化卷积神经网络的行人检测方法，其特征在于，二值化输入数据的获取方法为：在输入数据大于0时将其二值化为1，在输入数据小于或等于0时将其二值化为-1，将1和-1分别映射为1和0。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学;东南大学—无锡集成电路技术研究所，未经东南大学;东南大学—无锡集成电路技术研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810043902.1/1.html，转载请声明来源钻瓜专利网。

上一篇：基于自建神经网络的交通标志检测与识别方法
下一篇：基于卷积神经网络的道路目标检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于二值化卷积神经网络的行人检测方法在审

专利文献下载