[发明专利]一种基于长短期记忆网络的物体和部件联合检测方法有效
申请号: | 201810584336.5 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108875819B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 姚祺;龚小谨;林颖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 短期 记忆 网络 物体 部件 联合 检测 方法 | ||
1.一种基于长短期记忆网络的物体和部件联合检测方法,其特征是,包括如下步骤:
(1)采集多幅已知物体和部件目标框标签的图像I,
(2)对图像I进行处理获得特征图FI,再在特征图FI基础上获取物体候选区域集合Ro及物体候选区域集合Ro对应的区域特征Fo,以及部件候选区域集合Rp及部件候选区域集合Rp对应的区域特征Fp;
(3)构建基于长短期记忆网络(LSTM)的物体和部件联合检测网络,将物体和部件的候选区域集合及其区域特征输入到物体和部件联合检测网络中,利用带动量的SGD算法训练物体和部件联合检测网络;
(4)采用训练后的物体和部件联合检测网络对未知物体和部件目标框标签的待测图像进行处理获取物体和部件的检测结果。
2.根据权利要求1所述的一种基于长短期记忆网络的物体和部件联合检测方法,其特征是:
所述步骤(2)包括卷积层、候选区域网络模型和感兴趣区域池化模型,具体为:使用卷积层提取输入图像I的特征图FI,然后使用候选区域网络模型对特征图FI处理得到图像上物体候选区域集合Ro和部件候选区域集合Rp,使用感兴趣区域池化模型对特征图FI以及物体候选区域集合Ro和部件候选区域集合Rp进行处理得到每一个物体候选区域对应的区域特征集合Fo以及每一个部件候选区域对应的区域特征集合Fp;
对于物体或者部件,均采用相同方式进行处理获得候选区域集合;物体候选区域集合Ro采用以下方式处理获得:
首先,候选区域网络预先设定B个不同尺度的参考框,然后对于特征图FI上每一个像素点位置构建B个不同尺度的参考框,并预测计算像素点位置的B个候选区域:每一个候选区域由预测值集合[s,tx,ty,tw,th]描述,其中s表示候选区域中包含物体的预测概率,tx,ty分别表示候选区域中心点相对参考框中心点(xa,ya)的预测偏移值,tw,th分别表示候选区域的宽w和长h相对参考框宽wa和长ha的预测偏移值,具体采用以下公式计算候选区域的位置和大小:
xr=txwa+xa
yr=tyha+ya
wr=exp(tw)wa
hr=exp(th)ha
其中,xr、yr、wr、hr分别表示候选区域中心点的横纵坐标以及宽和长,xa、ya、wa、ha分别表示参考框的中心点横纵坐标以及宽和长,exp()表示指数函数;
初始计算[s,tx,ty,tw,th]随机生成,在之后的每次迭代运算中,在获得所有像素点位置对应的候选区域后,从所有候选区域中选择候选区域包含物体的预测概率s最高的前No个候选区域组成候选区域集合Ro输出;
接着,感兴趣区域池化模型将候选区域集合Ro中每一个候选区域在特征图FI上对应的区域池化成固定长度的特征Fo,具体是:
将候选区域均分成k×k个小格子,采用以下公式计算每个小格子的特征,组成k×k维候选区域特征:
Fo(i,j)=∑p∈bin(i,j)FI(p)/nij
其中,p表示小格子bin(i,j)处内部的像素点,nij表示小格子bin(i,j)处内部像素点的总数,i和j表示小格子的横纵序号,i、j=1~k;FI(p)表示特征图FI中的像素点p处的特征,Fo(i,j)表示小格子bin(i,j)的特征;
输出的k×k维候选区域特征再经过两个输出神经元个数都为Np的全连接层得到每一个候选区域对应的固定长度为Np的候选区域特征Fo。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810584336.5/1.html,转载请声明来源钻瓜专利网。