[发明专利]特征编码模型、视觉关系检测模型的训练方法及检测方法有效
| 申请号: | 201910650283.7 | 申请日: | 2019-07-18 |
| 公开(公告)号: | CN110390340B | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 朱艺;梁小丹;林倞 | 申请(专利权)人: | 暗物智能科技(广州)有限公司 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06K9/68 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李红团 |
| 地址: | 511458 广东省广州市南沙区丰泽东路106*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及视觉关系检测技术领域,具体涉及特征编码模型、视觉关系检测模型的训练方法及检测方法;其中,特征编码模型的训练方法包括获取初始特征编码模型;获取样本数据;将每个样本数据输入初始特征编码模型中;基于类别从视觉常识数据中提取引导图;根据引导图对初始特征编码模型进行训练,调整转换矩阵,以对每个目标区域的目标特征进行更新,得到每个目标区域的目标特征编码。利用视觉常识中与该类别相关的引导图一方面弥补了样本数据不足的缺陷,使得在对目标特征进行再次编码时能够有足够的样本数据支撑,另一方面保证了目标特征编码时就已经引入关系感知,为后续视觉关系的检测提供的条件,进而能够提高视觉关系检测的准确率。 | ||
| 搜索关键词: | 特征 编码 模型 视觉 关系 检测 训练 方法 | ||
【主权项】:
1.一种特征编码模型的训练方法,其特征在于,包括:获取初始特征编码模型;其中,所述初始特征编码模型包括级联至少一层的多头注意力模块,每个所述多头注意力模块的参数包括一组互相独立的转换矩阵;获取样本数据;其中,每个所述样本数据包括样本图像中目标区域的目标特征以及对应的类别;将每个所述样本数据输入所述初始特征编码模型中;基于所述类别从视觉常识数据中提取引导图;其中,所述引导图用于表示视觉常识对应于所述类别的目标类别;根据所述引导图对所述初始特征编码模型进行训练,调整所述转换矩阵,以对每个所述目标区域的目标特征进行更新,得到每个所述目标区域的目标特征编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暗物智能科技(广州)有限公司,未经暗物智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910650283.7/,转载请声明来源钻瓜专利网。





