[发明专利]用于生成电子文档的合并数据的系统和方法在审
申请号: | 201780058567.6 | 申请日: | 2017-08-04 |
公开(公告)号: | CN109791643A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | N·古兹曼;I·萨夫特 | 申请(专利权)人: | 瓦特博克有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q20/14;G06Q20/40;G06Q30/06;G06Q40/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑勇 |
地址: | 以色列*** | 国省代码: | 以色列;IL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子文档 交易参数 扣除 电子文档生成 非结构化数据 合并元数据 结构化数据 费用生成 合并 凭据 交易 检索 创建 分析 | ||
一种基于电子文档生成合并数据的系统和方法。该方法包括:分析第一电子文档以确定至少一个交易参数,所述第一电子文档指示包括至少一个费用的交易,其中所述第一电子文档包括至少部分非结构化数据;为第一电子文档创建范本,其中所述范本是包括所确定的至少一个交易参数的结构化数据集;基于所述范本检索第二电子文档,其中所述第二电子文档指示交易的凭据;基于扣除规则、所述范本和所述第二电子文档中的至少一个,来确定至少一个费用的至少一个可扣除费用;以及,基于所确定的至少一个可扣除费用生成合并元数据。
相关申请的交叉引用
本申请要求于2016年8月5日提交的美国临时申请No.62/371,221的优先权。该申请同时也是2016年11月28日提交的、现处于申请阶段的美国专利申请No.15/361,934的部分继续申请。上述申请的内容在此引入作为参考。
技术领域
本公开一般涉及数据系统中的文档验证,更具体地涉及基于电子文档内容的验证请求。
背景技术
顾客可以通过网络实时订购商家的旅行和住宿等服务。这些订单可以被立即接收和处理。然而,订单付款通常需要更多时间才能完成,尤其是为了保障被转移的资金。因此,商家通常要求顾客在下订单时实时提供付款保证。例如,顾客可以根据支付输入信用卡信息,并且商家可以在授权销售之前实时验证该信用卡信息。验证通常包括确定所提供的信息是否有效(即,信用卡号、有效期、PIN码和/或顾客名是否与已知信息匹配)。
一旦接收到此类保证后,便为顾客生成采购订单。采购订单提供订单的证明,例如采购价格、订购的商品和/或服务等。之后,生成订单的发票。采购订单通常用于指示需求的产品以及估算或提供的价格,而发票则通常用于指示实际提供的产品以及产品的最终价格。通常,订单发票所显示的购买价格与采购订单所显示的购买价格不同。例如,如果酒店的客人最初订购三晚住宿但最终第四晚继续入住,则采购订单的总价会反映出与后续发票不同的总价。发票总价与采购订单总价不同的情况是很难跟踪的,特别是对于每天接收大量订单的大型企业(例如,管理特定地区的数百或数千家酒店的大型酒店)。这些差异可能会导致企业的记录保存发生错误。
随着企业越来越依赖技术来管理与运营相关的数据(例如发票和采购订单数据),能够适当地管理和验证数据的合适系统早已成为成功的关键。特别是对于大型企业而言,企业每天使用的数据量是非常巨大的。因此,手动审查和验证此类数据是不切实际的。然而,记录保存文档之间的差异可能会给企业带来严重问题,例如,未能向税务机关正确报告收益。
目前存在一些解决方案能够自动识别扫描文档(例如,发票和收据)或其他非结构化电子文档(例如,非结构化文本文档)中的信息。而这些解决方案在准确标识和识别电子文档的字符和其他特征方面经常面临挑战。此外,输入的非结构化电子文档内容的降级通常会导致更高的错误率。结果,现有的图像识别技术在理想情况下(即,图像非常清晰)也并不能完全准确,而当输入图像清晰度不够时,它们的准确度通常更会急剧下降。此外,丢失或不完整的数据可能在随后的数据使用期间导致错误。许多现有的解决方案无法识别丢失的数据,除非例如结构化数据集中的字段并非是不完整的。
另外,现有的图像识别解决方案无法准确识别某些或所有特殊字符(例如,“!”、“@”、“#”、“$”、“%”、“&”等)。例如,一些现有的图像识别解决方案可能无法准确地将扫描的收据中包括的短划线识别为数字“1”。作为另一示例,一些现有的图像识别解决方案无法识别诸如美元符号、日元符号等特殊字符。
此外,这些解决方案在准备用于后续使用的识别信息时可能面临挑战。具体而言,许多这样的解决方案或者是以非结构化格式产生输出,或者只有在输入的电子文档被特定地格式化以供图像识别系统识别时,才能产生结构化输出。所产生的非结构化输出通常无法有效地处理。特别地,这种非结构化输出可以包含副本,并且可以包括在使用之前需要后续处理的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瓦特博克有限公司,未经瓦特博克有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780058567.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工作流的自动生成
- 下一篇:路面管理系统和路面管理方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理