[发明专利]一种面向示意图的对象检测方法有效
| 申请号: | 202111224290.4 | 申请日: | 2021-10-21 |
| 公开(公告)号: | CN113657415B | 公开(公告)日: | 2022-01-25 |
| 发明(设计)人: | 何绯娟;张新宇;陈周国;缪相林;刘荟荟 | 申请(专利权)人: | 西安交通大学城市学院;中国电子科技集团公司第三十研究所 |
| 主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 白文佳 |
| 地址: | 710048 陕西省西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 示意图 对象 检测 方法 | ||
本发明公开了一种面向示意图的对象检测方法,属于数据识别技术领域,包括:根据示意图生成若干个超像素区域,依据超像素区域中聚类中心点构造度量标准并更新聚类中心点;超像素划分为块矩形并经最大值池化处理,得到的特征图并根据其得到编码信息;随机选聚类中心点,利用编码信息、位置信息与聚类中心点的相似度得到编码信息和位置信息形成的聚类簇;将同一聚类簇的编码信息和位置信息分别进行融合形成大超像素块的特征信息和位置信息;将同一聚类簇的大超像素块的位置信息进行排序;将待检测对象周围不必要的位置信息进行去除,保留最符合真实数据的位置信息;完成示意图的对象检测。本发明对示意图的识别更加准确。
技术领域
本发明属于计算机视觉和数据识别技术领域,具体属于一种面向示意图的对象检测方法。
背景技术
示意图是一种高度抽象的知识载体,通常由点、线、矩形等几何形状或简笔画构成,用于刻画事物的结构、原理或机制。示意图广泛分布在MOOC网站、教学课件、技术文档等各类知识资源中;对这类特殊图像的分析与理解是跨媒体知识融合、智能答疑等知识密集型任务的重要基础,也是跨媒体智能的重要组成部分。
示意图中的对象检测是示意图理解的基础。但已有的对象检测方法主要针对自然图像,无法适用示意图。主要原因在于两者具有迥异的视觉特性:一是示意图的视觉信息稀疏,示意图在SIFT、SURF、FAST特征点的数量明显少于相同尺寸的自然图像;二是示意图存在“同形不同义、同义不同形”现象,即视觉上相同或相似的示意图可能表达不同语义,而视觉上差异较大的示意图也可能表达相同语义。传统的对象检测方法未考虑上述特性,因此导致传统的对象检测方法不能准确识别示意图,影响技术人员对技术的推理。
发明内容
为了解决现有技术中存在的问题,本发明提供一种面向示意图的对象检测方法,解决目前传统对象检测无法准确识别示意图的问题。
为实现上述目的,本发明提供如下技术方案:一种面向示意图的对象检测方法,包括以下步骤:
预设示意图中的超像素区域,在预设的超像素区域中均匀分配聚类中心点,依据聚类中心点构造度量标准,根据度量标准更新所有聚类中心点,得到若干个超像素区域;
将每个所述超像素区域划分为块矩形,并对所述块矩形进行最大值池化处理,得到规模为的特征图;
将所述的特征图输入预设的全连接神经网络和编码器神经网络得到均值向量和标准差向量,根据所述均值向量和标准差向量依据重参数化技巧计算编码信息;
通过预设的编码器神经网络获得所述编码信息对应的位置信息,在所述编码信息和编码信息对应的位置信息中分别随机选取聚类中心点;利用每一编码信息和位置信息与所有聚类中心点的相似度得到所有编码信息和位置信息所形成的聚类簇;将同一聚类簇中的编码信息和位置信息分别进行融合形成大超像素块的特征信息和位置信息;
将所述同一聚类簇中所形成的大超像素块的位置信息按照置信度进行排序;通过非极大抑制算法抑制将示意图中待检测对象周围不必要的位置信息进行去除,保留最符合真实数据的位置信息;完成示意图的对象检测。
进一步的,所述根据均值向量和标准差向量依据重参数化技巧计算完编码信息后,还包括,将所述编码信息输入基于反卷积模型的解码器神经网络重建示意图的特征信息;
在所述形成大超像素块的特征信息和位置信息后,还包括,将所述同一聚类簇中所形成的大超像素块的特征信息输入二值量化残差神经网络,将所述特征信息和残差神经网络中参数矩阵进行二值化并保留一个浮点数缩放因子;通过对二值化后的特征信息和参数矩阵的位运算和向量内积运算得到超像素块的对象标签;
在所述示意图的对象检测完成后,还包括,将所述大超像素块的对象标签和位置信息与重建示意图上特征信息和符合真实数据的位置信息进行计算得到模型损失,并根据模型损失计算梯度信息;对梯度信息进行抑制后利用反向传播算法将梯度信息传递来指导上述所有步骤中的神经网络进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学城市学院;中国电子科技集团公司第三十研究所,未经西安交通大学城市学院;中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111224290.4/2.html,转载请声明来源钻瓜专利网。





