[发明专利]一种基于逻辑学习的多图检索方法有效

专利信息
申请号: 202110337481.5 申请日: 2021-03-30
公开(公告)号: CN112905820B 公开(公告)日: 2022-11-11
发明(设计)人: 郭倩;钱宇华;梁新彦 申请(专利权)人: 山西大学
主分类号: G06F16/532 分类号: G06F16/532;G06F16/55;G06F16/583;G06V10/44;G06V10/82;G06V10/774;G06N3/04;G06N3/08
代理公司: 山西五维专利事务所(有限公司) 14105 代理人: 雷立康
地址: 030006 山*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 逻辑 学习 检索 方法
【权利要求书】:

1.一种基于逻辑学习的多图检索方法,其特征在于,包括如下步骤:

1)收集并预处理数据集;

2)训练一组深度学习网络特征提取器并提取图像的特征组;

3)将步骤2)所得的特征组融合为各个图的特征;

4)利用逻辑关系和训练集特征构造逻辑三元组,并进行训练逻辑运算网络;

其中,训练逻辑运算网络的具体步骤为:

4.1)利用逻辑规则构造逻辑三元组:利用逻辑规则构造逻辑三元组L=I,O,R;

其中,I表示待检索多图的特征,I={I1,I2},I包含两张待检索图的特征I1和特征I2

O表示I对应的逻辑输出特征;

R表示I和O之间的逻辑运算关系,R={And、Or、Exclusive、Inverter};

R中的And表示在O中同时包含I1和I2的特征;

Or表示在O中I1和I2的特征至少包含一个;

Exclusive表示在O中I1和I2的特征只能包含一个;

Inverter表示在O中不包含I1和I2的特征;

关系R形式化表示为使用关系R、训练集Str的特征E1和训练集Dtr的特征E3构造逻辑三元组L:对于每个逻辑三元组来说,在E1中随机选择两个特征作为I,I的这两个特征来自不同的类别,在R中随机选择某个逻辑关系ri作为该逻辑三元组的关系,根据该逻辑关系,计算得到O中应当包含的具体特征类别,然后在E3中随机选择一个符合该逻辑需求的特征作为O,迭代该过程,完成逻辑三元组的构造;

4.2)训练逻辑运算网络LON:逻辑运算网络LON是一个自编码器网络,包括编码器和解码器,编码器和解码器各由多个全连接层组成,它的损失函数为均方误差损失函数,在训练阶段,将逻辑三元组L的I作为逻辑运算网络LON的输入,O作为逻辑运算网络LON的输出,训练的最大迭代次数为epoch:在每一次迭代中,将I级联然后输入到编码器网络中,然后再解码为符合逻辑需求的输出O*,使输出O*接近O,当网络LON的损失在连续十次迭代中不再下降时提前停止其训练,或者网络LON的迭代次数达到最大迭代次数epoch时停止其训练,针对每一种逻辑关系各训练一个逻辑运算网络LONi,即每个关系ri隐式地嵌入到一个逻辑运算网络LONi中,所有逻辑运算网络的集合为

5)在检索阶段,对逻辑输出特征进行处理并输出检索结果。

2.根据权利要求1所述的一种基于逻辑学习的多图检索方法,其特征在于,所述步骤1)中包含单类目标的数据集表示为S={(xi,yi)|1≤i≤|S|};

其中xi为单类目标图像,每个xi只包含一类目标,yi为xi的类别,数据集S共有z类,|S|为xi的数量;

包含多类目标的数据集表示为D={(x′i,y′i)|1≤i≤|D|};

其中x′i为多类目标图像,每个x′i包含两类或两类以上目标,y′i为x′i的类别,|D|为x′i的数量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110337481.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top