[发明专利]一种报告类型匹配方法及装置在审
申请号: | 202211376276.0 | 申请日: | 2022-11-04 |
公开(公告)号: | CN115661849A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 周杨诗宇;刘闯;甘杰;江波;李麓;熊文瑜;胡润泽;吴林飞;李蒙 | 申请(专利权)人: | 东进之光(武汉)科技发展有限公司 |
主分类号: | G06V30/418 | 分类号: | G06V30/418;G06V30/413;G06T7/90;G06T7/66 |
代理公司: | 湖北创融蓝图知识产权代理事务所(特殊普通合伙) 42276 | 代理人: | 黄太林 |
地址: | 430074 湖北省武汉市东湖新技术开发区光谷*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 报告 类型 匹配 方法 装置 | ||
本发明公开了一种报告类型匹配方法及装置。通过将报告图像进行分块并基于灰度值进行模糊处理形成新的像素图,之后计算出所有色块的像素重心值,以此匹配对应的报告类型,无需进行文字信息提取与存储便能够进行报告匹配,保证了隐私;精度的提升不用进行大规模海量真实数据的训练,有特定表格的格式即可;由于其脱敏的特性,让云端部署实施成为了可能,能够大大降低成本。
技术领域
本发明涉及报告类型匹配技术领域,尤其涉及一种报告类型匹配方法及装置。
背景技术
随着人工智能技术的发展,OCR检测及文字提取技术已经趋于成熟,目前在数据的归档、信息的提取、身份证识别等多种场景有着显著的成效。目前许多行业也将该技术应用到了一些检验报告的信息提取中,但是由于报告种类的多样性与复杂性,关于如何在多种不同格式的纸质报告中,匹配出对应报告的类型,从而进行更加精准的文字提取也是十分重要的。目前的主要方式是通过识别出的报告大小、文字标题、文本内容等进行处理,但是一旦识别的报告属于涉密或者存在隐私的信息时,这种方式就有很大的局限性:
1、传统方式需要对报告中的关键信息进行提取,之后再匹配,存在泄密风险;
2、通过大小匹配的方式仅能简单区分大小具有明显区别的报告;
3、由于其涉密材料的特殊性质,匹配方法基本无法封装为云服务,间接增加了实现成本。
发明内容
本发明通过提供一种报告类型匹配方法及装置,解决了现有技术中存在的技术问题。
本发明提供了一种报告类型匹配方法,包括:
获取待匹配灰度图像,将所述待匹配灰度图像进行分块处理,得到图像块;
计算各图像块的灰度均值;
对各图像块进行均值赋值处理;
通过公式和计算各图像块的像素重心点Pc(Xc,Yc)的坐标;其中,Di为第i个图像块的灰度均值,xi为第i个图像块的横坐标,yi为第i个图像块的纵坐标,G为总灰度值;
将像素重心点Pc(Xc,Yc)的坐标与预设的模板库中的像素重心点坐标进行比较,得到匹配的模板。
具体来说,所述计算各图像块的灰度均值,包括:
通过公式Dn=(gs+gs+1+gs+2……ge)/La*Lb计算得到图像块n的灰度均值Dn;其中,gs、gs+1、gs+2……ge分别为所述图像块n中各像素点的灰度值,La为图像块的横像素长度,Lb为图像块的纵像素长度。
具体来说,所述将像素重心点Pc(Xc,Yc)的坐标与预设的模板库中的像素重心点坐标进行比较,得到匹配的模板,包括:
比较所述像素重心点Pc(Xc,Yc)的坐标与所述预设的模板库中的像素重心点坐标之间的距离,所述距离最近的像素重心点对应的模板为匹配出的模板。
本发明还提供了一种报告类型匹配装置,包括:
分块模块,用于获取待匹配灰度图像,将所述待匹配灰度图像进行分块处理,得到图像块;
灰度均值计算模块,用于计算各图像块的灰度均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东进之光(武汉)科技发展有限公司,未经东进之光(武汉)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211376276.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湿拌砂浆及其制备方法
- 下一篇:一种自动喷雾化消毒设备