[发明专利]用于从成像文件提取文本的方法和设备有效
申请号: | 201610931615.5 | 申请日: | 2016-10-31 |
公开(公告)号: | CN107045632B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 凯文·克强·邓 | 申请(专利权)人: | 尼尔森(美国)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62;G06K9/03 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华;何月华 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 成像 文件 提取 文本 方法 设备 | ||
1.一种用于从文件的图像提取文本的方法,所述方法包括:
利用处理器将所述文件的所述图像分段为对应于所述文件中的个体字符的局部子图像;
利用所述处理器,通过如下方式确定所述子图像中的第一子图像与基准子图像的视觉相关性:
将所述子图像中的所述第一子图像变换成具有对应于所述基准子图像的空间取向以确定变换的子图像;
在所述变换的子图像周围添加边界;
针对所述基准子图像相对于由所述边界限定的分界线内的所述变换的子图像的不同位置,计算所述变换的子图像和所述基准子图像之间的相关值;以及
将所述相关值中的最大相关值分配为所述子图像中的所述第一子图像与所述基准子图像的所述视觉相关性;
利用所述处理器基于各自的所述子图像与所述基准子图像的相应的视觉相关性将所述各自的所述子图像分组为群集,所述基准子图像与被分组为所述群集的所述各自的所述子图像之间的所述相应的视觉相关性超出相关性阈值;
利用所述处理器基于被分组为所述群集的所述子图像识别用于所述群集的指定字符;以及
利用所述处理器将所述指定字符与所述文件的所述图像中与被分组为所述群集的所述各自的所述子图像相关联的位置相关联。
2.如权利要求1所述的方法,其中,识别所述指定字符而不使用光学字符识别引擎。
3.如权利要求1所述的方法,还包括通过如下方式识别用于所述群集的所述指定字符:
向人类检查者呈现与所述群集相关联的代表性子图像;以及
接收来自所述人类检查者的指示所述指定字符的反馈。
4.如权利要求1所述的方法,其中,基于与所述群集相关联的代表性子图像的光学字符识别来识别所述指定字符。
5.如权利要求4所述的方法,其中,所述代表性子图像对应于被分组为所述群集的所述子图像中的第一子图像。
6.如权利要求4所述的方法,其中,所述代表性子图像为被分组为所述群集的所述各自的所述子图像的合成物。
7.如权利要求1和4至6中任一项所述的方法,还包括:
基于用于所述群集的代表性子图像的光学字符识别分析的输出来确定所述指定字符的可靠性;以及
当所述指定字符被确定为可靠时,自动地将所述指定字符分配给所述群集。
8.如权利要求7所述的方法,还包括:
当所述指定字符被确定为不可靠时,将所述代表性子图像与存储的子图像相比较,所述存储的子图像与先前由人类检查者验证的存储的指定字符相关联;以及
当所述代表性子图像与所述存储的子图像之间的视觉相关性超出所述相关性阈值时,自动地将所述存储的指定字符分配为用于所述群集的所述指定字符。
9.如权利要求7所述的方法,还包括:当所述指定字符被确定为不可靠时,提示人类检查者验证所述指定字符。
10.如权利要求9所述的方法,其中,当通过所述光学字符识别分析生成的置信度值不满足置信度阈值时,将所述指定字符确定为不可靠的。
11.如权利要求10所述的方法,其中,提示所述人类检查者验证所述指定字符包括:
当所述置信度值不满足所述置信度阈值且满足确认阈值时,在所述代表性子图像旁边显示所述指定字符,以及请求所述人类检查者确认所述指定字符对应于所述代表性子图像;以及
当所述置信度值不满足所述确认阈值时,显示所述代表性子图像以及请求所述人类检查者识别所述代表性子图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尼尔森(美国)有限公司,未经尼尔森(美国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610931615.5/1.html,转载请声明来源钻瓜专利网。