[发明专利]文档扫描器在审
申请号: | 201680022039.0 | 申请日: | 2016-03-30 |
公开(公告)号: | CN107980139A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 克里希讷杜·乔杜里;陈璐;戴维·彼得鲁;布勒斯·阿格拉-阿尔卡斯 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06T3/40 |
代理公司: | 中原信达知识产权代理有限责任公司11219 | 代理人: | 李佳,穆德骏 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 扫描器 | ||
1.一种计算机实现的方法,所述方法包括:
接收扫描请求,其中,所述扫描请求包括多个文本图像,每个文本图像表示文本文档的一部分,其中,所述多个文本图像包括至少部分地重叠的第一文本图像和第二文本图像;
对于所述多个文本图像中的每个文本图像:
校正所述文本图像来生成具有平行图像线的文本图像,
生成围住所述文本图像中的一个或者多个连接组件的多个词语边界框,其中,每个词语边界框与相应的词语相关联,以及
对于所述文本图像中的每个相应的词语,生成表示该相应的词语的多个点;
将所述多个文本图像进行组合来形成单个文本文档,包括:通过将与所述第一文本图像相关联的第一点集和与所述第二文本图像相关联的第二点集进行匹配,来将所述多个文本图像中的所述第一文本图像与所述多个文本图像中的所述第二文本图像进行组合;以及
提供所组合的图像作为可扫描文档。
2.根据权利要求1所述的方法,其中,校正所述多个文本图像中的每个文本图像包括:
确定所述文本图像中的多个连接组件,每个连接组件是符号的填充部分;
基于所述多个连接组件来生成在所述文本图像中的多个图像线,所述多个图像线包括垂直线元和水平线元;
基于所述多个图像线来计算水平消失点和垂直消失点;以及
将几何公式应用于所述第一消失点和第二消失点来恢复在所述文本图像中的平行线。
3.根据权利要求2所述的方法,其中,所述多个图像线包括多个垂直线元和多个水平线元,每个垂直线元是穿过连接组件的竖直部分的骨架线,每个水平线元是穿过相邻连接组件集的中心的回归线。
4.根据权利要求3所述的方法,其中,基于所述多个图像线来计算水平消失点和垂直消失点进一步包括:
使用所述水平线元来计算所述水平消失点;以及
使用所述垂直线元来计算所述垂直消失点。
5.根据权利要求4所述的方法,进一步包括:选择垂直线元对和水平线元对,使用所选择的水平线元对来计算所述水平消失点并且使用所选择的垂直线元对来计算所述垂直消失点。
6.根据权利要求5所述的方法,其中,选择水平线元对或者垂直线元对包括:基于线段长度来执行对所述多个水平线元或者垂直线元的降序排序;以及
从所述多个线元的前20个百分位选择第一线元并且从前50个百分位选择第二线元。
7.根据前述权利要求中的任一项所述的方法,其中,生成多个词语边界框包括:涂抹所述连接组件中具有低于预定阈值的空白量的相邻连接组件。
8.根据前述权利要求中的任一项所述的方法,其中,所述第一点集和所述第二点集是词语形状描述符,并且所述方法进一步包括:计算所述多个词语边界框中的每个词语边界框的词语形状描述符。
9.根据权利要求8所述的方法,其中,计算词语边界框的词语形状描述符包括:
将所述词语边界框平铺到固定单元格网格中;以及
对所述词语边界框执行方向梯度直方图来生成与所述词语边界框相关联的词语的形状的向量描述符。
10.根据前述权利要求中的任一项所述的方法,其中,将所述第一文本图像与所述第二文本图像进行组合包括:将所述第一文本图像与所述第二文本图像融合。
11.根据前述权利要求中的任一项所述的方法,其中,在与所述第一文本图像相关联的所述第一点集和与所述第二文本图像相关联的所述第二点集之间的匹配点的数目超出匹配点的阈值数目。
12.根据前述权利要求所述的方法,其中,将所述多个文本图像进行组合进一步包括:
融合形成所述单个文本文档的所述多个文本图像;
对所述单个文本文档进行纠偏;以及
对所述单个文本文档执行光学字符辨识。
13.一种系统,包括:
一个或者多个计算机;
一个或者多个存储指令的存储设备,所述指令在由所述一个或者多个计算机执行时使得所述一个或者多个计算机执行前述权利要求中的任一项所述的方法。
14.一种编码有计算机程序的计算机存储介质,所述程序包括指令,所述指令在由一个或者多个计算机执行时使得所述一个或者多个计算机执行权利要求1至12中的任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680022039.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:圆形自定义控件执行动画的方法及装置
- 下一篇:跟踪分布式计算系统中的数据流