[发明专利]一种机加工图纸关键信息提取和敏感信息脱敏的模型方法有效

专利信息
申请号: 202110659529.4 申请日: 2021-06-11
公开(公告)号: CN113569629B 公开(公告)日: 2023-09-15
发明(设计)人: 易康;韩倩倩 申请(专利权)人: 杭州玖欣物联科技有限公司
主分类号: G06V30/422 分类号: G06V30/422;G06V30/19;G06V10/764;G06V10/82;G06N3/0442;G06N3/0464;G06N3/08
代理公司: 杭州中利知识产权代理事务所(普通合伙) 33301 代理人: 李光
地址: 310000 浙江省杭州市滨江区浦沿*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 加工 图纸 关键 信息 提取 敏感 模型 方法
【权利要求书】:

1.一种机加工图纸关键信息提取和敏感信息脱敏的模型方法,其特征在于:具体包括以下步骤:

S1.获取图纸url地址;

S2.下载图纸;

S3.对步骤S2所下载的图纸进行格式过滤并转换;

S4.对图纸方向进行检测,保证输入为水平方向图纸;

S5.准备图纸模板,对各类图纸裁剪出特定模板;

S6.通过模板匹配切割出ROI区域;

S7.对图纸倍数放大;

S8.通过CTPN网络对图纸进行文本框检测,得到所检测文本信息的坐标位置;

S9.通过CRNN网络对图纸进行关键信息识别,得到文本信息;

S10.参数搜索进行结果校准;获取特定文本信息的坐标位置区域范围,然后在该范围内进行参数搜索,以找出识别准确率最高的坐标;

S11.对图纸敏感信息进行脱敏;具体包括以下步骤:

a.获取S8检测到的文本信息所在文本框的位置坐标;

b.将步骤a的文本信息所在文本框的位置坐标通过步骤S7中的放大比例进行同比例缩放,映射回原图纸;

c.将步骤b获得的原图纸文本信息进行掩码模糊处理,输出脱敏图纸;

S12.通过计算S8中文本信息所在文本框的位置坐标与敏感信息中心位置的距离,达到目标信息与标签位置精准定位的目的,实现版面还原,达到信息结构化提取的目的;

S13.对图纸进行二维码融合,方便线上对图纸的追踪;

S14.将已脱敏的图纸上传至obs;

S15.将图纸提取结果返回给应用侧。

2.如权利要求1所述的一种机加工图纸关键信息提取和敏感信息脱敏的模型方法,其特征在于:步骤S3中对步骤S2所下载的图纸格式进行判断,若为常用的图片格式,则进入步骤S4,所述常用的图纸格式包括pdf、bmp、dib、png、jpg格式;若为非图纸,则程序结束;若为pdf格式图纸,则将pdf格式转为png格式。

3.如权利要求1所述的一种机加工图纸关键信息提取和敏感信息脱敏的模型方法,其特征在于:步骤S4中对输入图纸方向进行检测,若输入图纸为水平方向,则保持不变;若输入图纸为垂直方向,则旋转90度,将垂直方向图纸转为水平方向图纸。

4.如权利要求1所述的一种机加工图纸关键信息提取和敏感信息脱敏的模型方法,其特征在于:步骤S8中所述CTPN网络由CNN和BiLSTM网络组成,CNN负责提取文本的空间信息,BiLSTM负责提取时序信息。

5.如权利要求1所述的一种机加工图纸关键信息提取和敏感信息脱敏的模型方法,其特征在于:步骤S9中所述CRNN网络由CNN、BiLSTM、CTC网络组成,CNN负责提取文本的空间信息,BiLSTM负责提取时序信息,CTC负责信息翻译。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州玖欣物联科技有限公司,未经杭州玖欣物联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110659529.4/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top