[发明专利]一种基于深度学习的行人、车辆附属品识别及检索方法在审
| 申请号: | 201710708646.9 | 申请日: | 2017-08-17 |
| 公开(公告)号: | CN107577994A | 公开(公告)日: | 2018-01-12 |
| 发明(设计)人: | 殷越铭;樊小萌;孟凡利;胡海峰 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 南京知识律师事务所32207 | 代理人: | 李吉宽 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于深度学习的行人、车辆附属品识别及检索方法。首先对图像中像素点的八个方向进行采样,经量化采样得到纹理信息,并用双交叉编码器编码每像素点上两组十字双交叉的子集,形成总描述符;根据描述符及局部灰度联合分布密度提取局部直方图向量,形成纹理特征;根据提取纹理特征训练得到初始分类器,设定学习次数及精度要求;采用主动学习算法优化分类器,到预设精度要求时停止;最后使用训练完成的多示例多标签分类器进行识别,得到高精度的识别结果。本发明提出的系统具有自适应性强、可信度强、整体性能稳健的优点。在提取图像特征时采用双交叉模式的编码方法,可以实现最大联合熵,使图像信噪比最大化,增大图像鲁棒性。 | ||
| 搜索关键词: | 一种 基于 深度 学习 行人 车辆 附属品 识别 检索 方法 | ||
【主权项】:
一种基于深度学习的行人、车辆附属品识别及检索方法,其特征在于包括以下步骤:步骤001:对每帧图像中的每一个像素点,以其为圆心画内外两个圆,在内外圆上各取0、π、和这八个方向;步骤002:对步骤001中像素点的八个方向上的纹理信息进行量化,分配一个唯一的十进制数:定义函数S(y):y是变量,Io、分别是点0、Ai、Bi的灰度值;Ai、Bi分别是步骤001中像素点内圆、外圆上的点,DCPi是第i方向上的纹理信息量;第0‑第7方向分别指0、π、和步骤003:对于步骤002中的DCPi,定义{DCP0,DCP2,DCP4,DCP6}作为第一子集、{DCP1,DCP3,DCP5,DCP7}作为第二子集;这两个子集构建一个十字的形状,构成双交叉模式,出现最大联合熵;步骤004:将步骤003中的两个子集分组为两个交叉编码器,分别命名为DCP‑1、DCP‑2,在表情子区域图像中的像素点的代码表述为:两个交叉编码器构成总描述符DCP:DCP={DCP‑1,DCP‑2};步骤005:从每个区域提取直方图向量R:R=T{f(x,y)=j},j=0,1,...,n‑1,这里T为局部区域内像素灰度的联合分布密度,f(x,y)表示图像局部区域中心像素点的灰度值,j表示第j灰度级,n为直方图的灰度范围,为256,R是区域中具有第j级灰度值的像素数目,将这些局部直方图串接为一个序列H,H={(R1,R2,...,Rn1×n1)1,(R1,R2,...,Rn2×n2)2}作为纹理特征,其包含的多示例构成未标记样本集U;步骤006:从Corel图像数据集输入己标记训练集L,未标记样本集U,其中NL表示已标记多示例包的个数,NU表示未标记多示例包的个数;步骤007:使用K近邻算法、K‑means算法、决策树、Boosting算法和支持向量机算法在已标记训练集L中构造5个初始分类器F1,F2,...,F5,得到每个类别标签分类器的目标方程fK(k=1,2,...,5);步骤008:设定超时次数门限M以及分类器精度要求A,并定义精度confK(k=1,2,...,5),其表达式为:confK=1/exp(|Σi=1NUI[YiUk>0]÷NU-Σi=1NLI[YiLk>0]÷NL|)]]>上式中,I[...]是一个指示函数,满足I[...]给定条件则其值为1,否则取值为0;表示第k个分类器中第i个己标记多示例包的标签,表示第k个分类器中第i个未标记多示例包的标签,表示已标记多示例包在第k个分类器中正标签的平均值,表示未标记多示例包在第k个分类器中预测的正标签的平均值;步骤009:用初始分类器F1,F2,...,F5对未标记样本集U中的多示例包Bi(i=1,2,...,NU)进行标注,并对每个分类器计算分类器可信度confK(k=1,2,...,K);步骤010:计算每个未标记多示例包样本的最小分类距离min_dis(Bi),其表达式如下:min_dis(Bi)=mink=1,2,...,K[(1confk)1-β*(maxj=1,2,...,mi|fk(xi‾)|β||ωk||)],(i=1,2,...,NU)]]>上式中,为第i个示例包中所有示例xij对于第k个SVM分类器的超平面的平均距离,β(β∈[0,1])是平衡分类器可信度和多示例包中示例到超平面平均距离这两个指标的相对重要程度的权衡参数,并设定初始值;步骤011:计算得出最不确定的多示例包B*,并对B*进行标注,置入训练集L得到新的标记训练集L’,同时从未标记多示例包中把B*去掉,再利用新得到的训练集L’重新构造分类器;步骤012:将M减一,若M>0则判断分类精度是否满足预设要求A,若精度小于A则返回步骤009,若精度大于A或M=0进入步骤013;步骤013:使用训练完成的多示例多标签分类器对视频提取特征进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710708646.9/,转载请声明来源钻瓜专利网。





