[发明专利]一种采用机器学习进行图纸布局分类识别的方法在审

专利信息
申请号: 202110040792.5 申请日: 2021-01-13
公开(公告)号: CN112733735A 公开(公告)日: 2021-04-30
发明(设计)人: 储琳琳;宗明;张宇俊;肖业凡;朱夏;王经纬;顾志铭;翟清纲;辛洪波;张晓莉 申请(专利权)人: 国网上海市电力公司;上海科路信息技术有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62;G06N20/00;G06T5/30;G06T7/11
代理公司: 上海兆丰知识产权代理事务所(有限合伙) 31241 代理人: 章蔚强
地址: 200122 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 采用 机器 学习 进行 图纸 布局 分类 识别 方法
【说明书】:

发明公开了一种采用机器学习进行图纸布局分类识别的方法,通过步骤1图纸布局特征提取,步骤2机器学习模型训练,步骤3图纸区域布局分类,从而获得图纸要素布局的分类结果,图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。本发明能够实现对于图纸的快速分类。

技术领域

本发明涉及一种用于图纸处理领域的采用机器学习进行图纸布局分类识别的方法。

背景技术

图纸是一种市政规划、工程建筑、机械设计等诸多领域的常用技术文件。在图纸打印输出为图纸电子文件后,图纸内容以图像或图形形式存在,其中所包含的大量原始要素信息就丢失了。如市政规划的详细控制图纸是电网建设规划中的重要依据和资料来源,它们在公开发布/发行时,图纸中的文字,图层,图形,色块等都已转换为图形或图像。这给使用中图纸要素信息的识别和提取带来极大不便。

由于图纸要素复杂,根据图纸中所包含的要素内容,图纸要素区域可分为图形区域、表格文字区域、标题区域、图例区域等。图纸要素布局的边界可根据图框及分割线进行划定,图纸中要素区域形状为矩形。不同来源图纸的要素布局不统一,相同类别的图纸,图框及分割线的布局位置相对固定。由于不同图纸要素区域中的内容识别和信息提取方法具有显著差异,图纸布局结构的分类识别是后续图纸要素区域内容识别和信息提取的基础,也是技术人员的主要目标。

发明内容

本发明的目的是为了克服现有技术的不足,提供一种采用机器学习进行图纸布局分类识别的方法,能够对图纸进行快速分类。

实现上述目的的一种技术方案是:一种采用机器学习进行图纸布局分类识别的方法,包括如下步骤:

步骤1,图纸布局特征提取,具体步骤如下;

步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;

步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;

步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;

步骤1.4,对线图图像进行归一化处理,将不同大小的图纸线条图像缩放为统一大小;

步骤1后得到统一大小的灰度图像,即为图纸布局特征图像;

步骤2,机器学习模型训练,具体步骤如下;

步骤2.1,训练及验证数据集的准备,选择一定数量的各类型图纸文件,执行第一步的图纸布局特征提取处理,并进行人工布局分类标签;通过擦除图像中部分线条,修改线条颜色灰度的方法,生成扩展训练及验证图像集;得到满足模型训练及验证的一定规模的图纸布局特征图像集合;

步骤2.2,模型的选择与训练,使用训练图像集,测试图像集数据,基于InceptionResNetV2卷积神经网络基础模型,通过多次训练和验证,生成模型权重数据,参数如下:

优化器:RMSProp算法;

LOSS函数:Categorical Crossentropy;

步骤3,图纸区域布局分类,具体步骤如下;

步骤3.1,对待分类的图纸集合,执行第一步图纸布局特征提取的预处理过程,得到归一化的图纸要素特征图像集合;

步骤3.2,使用经第二步训练得到的模型参数,对待分类的图纸要素特征图像集合进行分类,获得图纸要素布局的分类结果;

图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;上海科路信息技术有限公司,未经国网上海市电力公司;上海科路信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110040792.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top