[发明专利]一种基于神经网络的快速行人检测方法有效
申请号: | 201710051125.0 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106934344B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 彭进业;胡洋;王珺;李展;祝轩;王琳;文才;艾娜 | 申请(专利权)人: | 西北大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 61216 西安恒泰知识产权代理事务所 | 代理人: | 王芳 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 快速 行人 检测 方法 | ||
1.一种基于神经网络的快速行人检测方法,该方法的检测对象为任一路面的彩色图像,其特征在于,包括:
步骤一,将彩色图像数据转换为一个3x448x448的矩阵;
步骤二,对3x448x448的矩阵进行25次卷积或最大池化操作,得到一个1024x14x14的矩阵;
将所述1024x14x14的矩阵调整为14x14x1024的矩阵,所述14x14x1024的矩阵表示图像被分割为14x14个空间位置,每一个空间位置上有一个1024维向量;
步骤三,依次选取14x14个空间位置中的一个空间位置作为当前空间位置;
在该当前空间位置上预设9个窗口,所述9个窗口包围该空间位置的行人,设该当前空间位置上窗口的横坐标为xn,窗口的纵坐标为yn,窗口的宽度为wn,窗口的高度为hn,n=1,2,...,9;
(1)将该当前空间位置上的1024维向量通过一个全连接层,得到45维向量,所述45维向量包括该当前空间位置的窗口的行人局部概率Pn,窗口调整后的横坐标x′n,窗口调整后的纵坐标y′n,窗口调整后的宽度w′n,窗口调整后的高度h′n,n=1,2,...,9;
选取Pn中最大的值所对应的窗口作为当前窗口,将该当前窗口的行人局部概率作为该当前空间位置的局部概率Pij,1≤i≤14,1≤j≤14,i和j取整数;
(2)对步骤二得到的1024x14x14的矩阵进行卷积,得到256x14x14的矩阵;
将256x14x14的矩阵调整为50176维向量,将该50176维向量通过一个全连接层,得到196维向量;
通过Logistic回归公式将所述196维向量中的每一维映射到0~1之间得到Mij,所述Mij表示全局概率,1≤i≤14,1≤j≤14,i和j取整数;
步骤四,将Pij和Mij进行相乘,得到每个空间位置的行人总概率;
设置阈值a,若空间位置的行人总概率大于a,则该空间位置检测为行人;0.1≤a≤0.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710051125.0/1.html,转载请声明来源钻瓜专利网。