[发明专利]表单结构提取网络在审
申请号: | 201810483302.7 | 申请日: | 2018-05-18 |
公开(公告)号: | CN109389027A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | M·萨卡尔;B·克里什纳穆泰 | 申请(专利权)人: | 奥多比公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06T3/40;G06T7/11 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;张俊杰 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于检测和提取文档中准确和精确结构的方法和系统。文档的高分辨率图像被分割成图块集合。每个图块由卷积网络处理,并且随后递归网络集合针对每行和每列进行处理。公开了一种全局查找过程,其允许考虑递归神经网络进行精确评估所需要的“未来的”信息。高分辨率图像的使用允许精确和准确的特征提取,而分割成图块促进在合理的计算资源范围内处理高分辨率图像。 | ||
搜索关键词: | 高分辨率图像 图块 文档 递归神经网络 计算资源 使用允许 特征提取 网络处理 网络集合 单结构 分割 递归 卷积 集合 查找 检测 评估 全局 网络 | ||
【主权项】:
1.一种用于从文档的图像中提取结构的方法,所述方法包括:接收所述文档的高分辨率图像,所述高分辨率图像包括多个像素;从所述图像生成多个图块,所述图块中的每个图块包括来自所述高分辨率图像的像素的子集;通过神经网络处理图块,其中处理每个图块包括将像素分类为与所述文档的文档元素相关联,所述元素包括可填写表单字段以及与所述可填写表单字段相关联的文本内容;以及使用已分类的所述像素生成所述文档的可编辑数字版本,所述可编辑数字版本包括所述可填写表单字段和所述文本内容。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥多比公司,未经奥多比公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810483302.7/,转载请声明来源钻瓜专利网。