[发明专利]一种多规格文本协同定位和提取方法在审

申请号：	201711360636.7	申请日：	2017-12-18
公开（公告）号：	CN108875721A	公开（公告）日：	2018-11-23
发明（设计）人：	严京旗;张成栋;李进文;罗宝娟	申请（专利权）人：	南通艾思达智能科技有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	226299 江苏省南通***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种多规格文本协同定位和提取方法，包括如下步骤：步骤110获取文本图像数据；步骤120、图像归一化操作；步骤130、分离图像背景信息和需要采集的前景信息；步骤140、全局协同搜索，提取出预设格式的各个文本块区域；步骤150、局部优化搜索，在小范围内逐个优化各个文本区域的位置；步骤160输出各个文本块定位结果，提供给后续单字切分和识别模块。本发明利用图像处理、目标检测、协同搜索、局部优化等技术，满足格式化数据采集的要求，克服某些文本块退化后的漏检和错检问题并最大程度避免不必要的文本和噪声信息的干扰，提高格式化文本信息采集的准度和精度。
搜索关键词：	文本块搜索局部优化文本协同采集协同文本图像数据格式化格式化数据图像归一化单字背景信息定位结果分离图像目标检测前景信息图像处理文本区域文本信息预设格式噪声信息漏检文本退化输出全局优化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种多规格文本协同定位和提取方法，其特征在于，所述方法包括如下步骤：步骤110，获取文本图像数据；步骤120，图像归一化操作；图像归一化的方法包括，直线检测、旋转变换、尺度变换、亮度均衡，通过归一化操作得到大小、亮度、方向一致的文本图像；步骤130，在步骤120之后，分离图像背景信息和需要采集的前景信息；可通过色彩通道、亮度、颜色比例来分离背景信息和需要采集的前景信息；步骤140，全局协同搜索；在步骤130确定前景信息后，加载预先设定的格式化模板，通过全局协同搜索，得到有效信息最大化的位置，从而提取出预设格式的各个文本块区域；步骤150，局部优化搜索；在步骤140确定全局的格式文本区域后，在小范围内逐个优化各个文本块区域的位置；步骤160，输出；在步骤150局部优化搜索后，输出各个文本块，提供给后续单字切分和识别模块，文本定位和提取结束。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南通艾思达智能科技有限公司，未经南通艾思达智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711360636.7/，转载请声明来源钻瓜专利网。

上一篇：矢量字体的骨架线提取方法及装置
下一篇：字符识别与识别模型训练方法、装置和系统及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多规格文本协同定位和提取方法在审

专利文献下载