[发明专利]一种定位医疗票据表格四边的方法在审
申请号: | 201711287394.3 | 申请日: | 2017-12-07 |
公开(公告)号: | CN109902534A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 罗宝娟;张成栋;李进文;严京旗 | 申请(专利权)人: | 南通艾思达智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 崔自京 |
地址: | 226000 江苏省南通*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 四边 票据表格 票据图像 票据图像数据 图像处理技术 内容信息 输出结果 四边位置 图像黑边 直线检测 自动定位 连通域 三通道 黑边 填充 医疗 图像 保证 | ||
本发明涉及一种定位医疗票据表格四边的方法,所述方法包括如下步骤:步骤1:获取票据图像数据;步骤2:票据图像去黑边,图像黑边填充的颜色为RGB三通道的均值;步骤3:步骤2后,通过直线检测的方法,对图像进行转正;步骤4:步骤3后,通过对表格连通域的处理来定位表格的4个顶点;步骤5:结束,输出结果。本发明采用图像处理技术的方法可自动定位票据图像表格的四边位置,为后续定位表格中的内容信息及识别字符的准确性提供了保证。
技术领域
本发明涉及图像处理技术领域,更具体的说是涉及一种定位医疗票据表格四边的方法。
背景技术
表格表单是一种高度精炼,集中的信息表达手段,纸质表格被广泛的应用于数据采集,但是传统的人工数据录入方式效率低下、差错率高、成本昂贵,因此将纸质表格数据转换成电子数据是信息化必然趋势。医疗票据OCR的出现有效地辅助了办公人员进行票据扫描识别等单据的信息录入,提高资料电子化、数据格式化的效率。
医疗票据是一种表格。表格一般具有十分相似的表现形式,并且大多具有一些特定的表格要素。首先表格一般具有表头,标识了表格的用途;再者,表格一般还具有格线,限定了表格的信息区域并将各个填写区域划分开来。表格中一般还有填写单元的说明,如打印体的“姓名”表明了此项中应填写姓名而不是其他信息。这些表格的基本元素一般都出现在表格的固定位置,如表头一般出现在表格的顶部。他们构成了一张表格的概貌。这些固定信息能够帮助计算机确定要识别内容的大概位置。因此,表格的准确定位是票据识别的关键步骤,表格定位的质量直接影响到识别的内容是否完整。
医疗票据表格定位的难点在于图像中存在一些复杂的背景,如底纹、印章和图案等等,扫描过程中难免会造成图像光照不均匀、图像倾斜、黑边等问题,这些都会影响到表格的定位。
因此,提供一种不受外界因素干扰,可以对票据进行精准定位的方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种定位医疗票据表格四边的方法,利用图像处理领域的技术,能够准确提取出医疗票据表格四边,为后续的待识别内容的定位和识别识别提供了保证。
为了实现上述目的,本发明提供如下技术方案:
一种定位医疗票据表格四边的方法,具体包括以下步骤:
步骤1:获取票据图像数据;
步骤2:票据图像去黑边,图像黑边填充的颜色为RGB三通道的均值;
步骤3:步骤2后,通过直线检测的方法,对图像进行转正;
步骤4:步骤3后,通过对表格连通域的处理来定位表格的4个顶点;
步骤5:结束。
优选的,在上述一种定位医疗票据表格四边的方法中,所述步骤1中获取票据图像的方法包括:
①用数码相机拍摄得到的图像数据;
②用手机拍摄得到的图像数据;
③用扫描仪得到的图像数据;
④打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据
并按照标准算法解压后得到的图像数据。
优选的,在上述一种定位医疗票据表格四边的方法中,所述步骤3具体包括以下步骤:
步骤3.1:图像二值化;
步骤3.2:计算二值图像的连通域,得到面积大于thresh值得连通域区域;
步骤3.3:通过LSD直线检测的方法,检测出步骤3.2中的连通域中所有的直线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通艾思达智能科技有限公司,未经南通艾思达智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711287394.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手势识别装置及方法
- 下一篇:一种IOS平台的室内增强现实系统