[发明专利]仓储物流下的基于多重注意力和拓扑约束的密度估计方法有效

专利信息
申请号: 202110860327.6 申请日: 2021-07-29
公开(公告)号: CN113313091B 公开(公告)日: 2021-11-02
发明(设计)人: 聂秀山;孟令灿;王春涛;陶鹏;袭肖明;刘兴波;尹义龙 申请(专利权)人: 山东建筑大学;山东新北洋信息技术股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/46;G06K9/62;G06M1/272;G06Q10/08;G06N3/04;G06N3/08
代理公司: 济南泉城专利商标事务所 37218 代理人: 支文彬
地址: 250101 山东省济*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 仓储 物流 基于 多重 注意力 拓扑 约束 密度 估计 方法
【权利要求书】:

1.一种仓储物流下的基于多重注意力和拓扑约束的密度估计方法,其特征在于,包括如下步骤:

(a)计算机获取计数目标物体的原始图像,对原始图像进行预处理,用于模型的训练和测试;

(b)构建密度估计模型并对模型进行初始化,将训练样本输入密度估计模型中,通过最小化损失函数优化密度估计模型;

(c)固定优化后的密度估计模型,并将密度估计模型部署至服务器;

(d)图像采集设备采集图像输入密度估计模型,得到图像中物体的个数;

步骤(b)包括如下步骤:

(b-1)构建Conv-5、Conv-4、Conv-3和Conv-1,2的卷积层、批归一化层和激活层,通过VGG-16网络架构预训练Conv-5、Conv-4、Conv-3和Conv-1,2中的10层卷积层的权重参数,Conv-5卷积组的输出分别连接RMBB-1模块和MLA-1模块,Conv-4卷积组的输出分别连接RMBB-2模块和MLA-2模块,Conv-3卷积组的输出分别连接RMBB-3模块和MLA-3模块,将RMBB-1模块与MLA-1模块的输出进行相乘操作后进行双线性插值操作,将RMBB-2模块与MLA-2模块的输出进行相乘操作后与上采样结果相加并连接上采样操作和1×1卷积,将RMBB-3模块与MLA-3模块的输出进行相乘操作后与1×1卷积做加法运算后连接上采样操作和1×1卷积,1×1卷积后与Conv-1,2输出相加,将相加结果连接上采样操作和1×1卷积,完成密度估计模型的构建,密度估计模型中除了Conv-5、Conv-4、Conv-3和Conv-1,2的卷积层之外的其它网络参数采用随机初始化的方式进行参数初始化,MLA-1模块、MLA-2模块和MLA-3模块均为多重注意力模块;

(b-2)将训练样本中的目标图像输入到密度估计模型中,图像依次经过Conv-5、Conv-4、Conv-3和Conv-1,2卷积组提取目标初级特征,分别得到初级特征图f4、f3、f2和f1

(b-3)初级特征图f4经过RMBB-1模块得到细节增强特征图rf4,将初级特征图f4输入MLA-1模块,在空间维度上对初级特征图f4分别进行最大值池化操作和均值池化操作,得到特征图和特征图将特征图和特征图经过共享的卷积提取通道上的注意力信息,分别得到和将和相加后经过sigmoid激活得到注意力权重Fc1,将Fc1与初级特征图f4相乘得到经过通道维度注意力优化的特征图F′c1,将特征图F′c1在通道上分别求最大值和均值,得到F′max1和F′avg1,将F′max1和F′avg1在通道维度上拼接,拼接后经过卷积层降维得到通道为1的空间注意力权重将空间注意力权重经过sigmoid激活之后与特征图F′c1相乘,得到经过时空维度注意力优化的特征图AF′4

(b-4)将细节增强特征图rf4与特征图AF′4相乘得到特征图F′4,对特征图F′4进行双线性插值操作,得到与初级特征图f3维度相同的特征图F4out

(b-5)初级特征图f3经过RMBB-2模块得到细节增强特征图rf3,将初级特征图f3输入MLA-2模块,在空间维度上对初级特征图f3分别进行最大值池化操作和均值池化操作,得到特征图和特征图将特征图和特征图经过共享的卷积提取通道上的注意力信息,分别得到和将和相加后经过sigmoid激活之后得到注意力权重Fc2,将Fc2与初级特征图f3相乘得到经过通道维度注意力优化的特征图F′c2,将特征图F′c2在通道上分别求最大值和均值,得到F′max2和F′avg2,将F′max2和F′avg2在通道维度上拼接,拼接后经过卷积层降维得到通道为1的空间注意力权重将空间注意力权重经过sigmoid激活之后与特征图F′c2相乘,得到经过时空维度注意力优化的特征图AF′3

(b-6)将细节增强特征图rf3与特征图AF′3相乘得到特征图F′3,将特征图F′3与特征图F4out相加,对相加结果进行上采样操作,使用卷积核大小为1×1的卷积进行通道维度上降维,使其维度从512维降到256维,得到输出特征图F3out

(b-7)初级特征图f2经过RMBB-3模块得到细节增强特征图rf2,将初级特征图f2输入MLA-3模块,在空间维度上对初级特征图f2分别进行最大值池化操作和均值池化操作,得到特征图和特征图将特征图和特征图经过共享的卷积提取通道上的注意力信息,分别得到和将和相加后经过sigmoid激活之后得到注意力权重Fc3,将Fc3与初级特征图f2相乘得到经过通道维度注意力优化的特征图F′c3,将特征图F′c3在通道上分别求最大值和均值,得到F′max3和F′avg3,将F′max3和F′avg3在通道维度上拼接,拼接后经过卷积层降维得到通道为1的空间注意力权重将空间注意力权重经过sigmoid激活之后与特征图F′c3相乘,得到经过时空维度注意力优化的特征图AF′2

(b-8)将细节增强特征图rf2与特征图AF′2相乘得到特征图F′2,对特征图F′2与特征图F3out相加,对相加结果进行上采样操作,使用卷积核大小为1×1的卷积进行通道维度上降维,使其维度从256维降到128维,得到输出特征图F2out

(b-9)将初级特征图f1与特征图F2out相加,得到特征图F1′,对特征图F1′进行上采样操作还原输入图像的分辨率,上采样后经过一层卷积,输出模型计算的密度似然图f;

(b-10)通过公式计算得到拓扑持久损失式中mi为第i个显著点,Si第i个显著点对应的鞍点,f(·)为密度似然图f中点的值,c为图像中标记目标物体的数量,Mc为c个显著点的集合,为密度似然图f中c个显著点以外的点的集合;

(b-11)通过公式计算得到多层次计算损失式中M∈{1,2,3,4},N为模型训练时的批大小,Fjgt为j尺度下输入图像的真值图,⊙为相乘操作,||·||2为L2范数;

(b-12)通过公式计算不同尺度下多重注意力监督下的损失Q={4,3,2},i∈{4,3,2},Aigt为Agt分别调整到与Aip相同尺寸时的值,t为注意力图的阈值参数,t的取值为1e-5,xi为真值密度图Fgt中的一点,Fgt(·)为真值图中一点的值;

(b-13)通过公式计算模型损失式中λpres、λ1及λ2均为常数,利用模型损失对密度估计模型进行迭代优化,得到优化后的密度估计模型;

步骤(b-1)中的RMBB-1模块、RMBB-2模块和RMBB-3模块均由五个多分支模块以残差的方式连接而成,每个多分支模块后面使用ReLu激活函数激活,每个多分支模块由多尺寸小卷积核堆叠而成,每个多分支模块通过一层1×1的卷积层卷积,第一个多分支模块经过1×1的卷积层卷积后连接3×3空洞率为1的卷积层,第二个多分支模块经过1×1的卷积层卷积后依次连接1×3的卷积层和3×3空洞率为3的卷积层,第三个多分支模块经过1×1的卷积层卷积后依次连接1×3的卷积层、3×1的卷积层和3×3空洞率为3的卷积层,第四个多分支模块经过1×1的卷积层卷积后依次连接3×3的卷积层和3×3空洞率为5的卷积层,将第一多分支模块的结果、第二多分支模块的结果、第三多分支模块的结果和第四多分支模块的结果在通道维度拼接,拼接后使用11的卷积降维,将结果与第五多分支模块经过11的卷积层卷积后的结果相加,将相加结果经过ReLu激活输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学;山东新北洋信息技术股份有限公司,未经山东建筑大学;山东新北洋信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110860327.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top