[发明专利]基于未结构化电子文档而实时提供分析在审
| 申请号: | 201780030660.6 | 申请日: | 2017-05-16 |
| 公开(公告)号: | CN109154949A | 公开(公告)日: | 2019-01-04 |
| 发明(设计)人: | N·古兹曼;I·萨夫特 | 申请(专利权)人: | 瓦特博克有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/00;G06Q30/04;G06Q30/06;G06Q40/00 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑勇 |
| 地址: | 以色列*** | 国省代码: | 以色列;IL |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电子文档 规则集合 交易分析 分析电子文档 结构化电子 结构化数据 交易参数 分析物 文档 创建 实时提供 分析 退税 交易 | ||
本发明涉及一种用于基于未结构化电子文档而生成分析物的系统和方法。所述方法包括分析多个电子文档以确定每个电子文档的至少一个交易参数,其中所述分析电子文档中的至少一者包括至少部分未结构化数据;创建关于每个分析电子文档的模板,其中每个模板为包括关于所述相应电子文档的所述确定至少一个交易参数的结构化数据集;基于所述创建模板而获得至少一个交易分析规则集合,其中每个交易分析规则集合至少限定用于获得交易退税的要求;和基于所述至少一个交易分析规则集合、所述创建模板和至少一个企业参数而生成至少一个分析物。
相关申请的交叉引用
本申请要求提交于2016年5月18日的、申请号为62/337,885的美国临时申请的优先权。该申请还为提交于2016年11月28日的、目前正在审查中的、申请号为15/361,934的美国专利申请的部分继续申请。上述申请的内容通过引用整体并入本文。
技术领域
本公开整体涉及提供退税分析物,并且更具体地涉及基于电子文档而提供退税分析物。
背景技术
顾客可以通过网络实时向商家订购旅行和住宿等服务。这些订单可即时接收和处理。然而,关于订单的支付通常需要更多时间来完成,并且特别地,来确保正在转账的资金。因此,当订单正在发出时,商家通常需要顾客实时提供支付保证。作为一个实例,顾客依据支付可输入信用卡信息,并且商家可在确认销售之前实时验证该信用卡信息。验证通常包括确定所提供信息是否有效(即,信用卡号码、有效日、PIN码和/或顾客名称是否匹配已知信息)。
在接收此类保证时,可生成关于该顾客的购买订单。购买订单提供订单的证据,诸如,例如购买价格、所订货物和/或服务等。随后,可生成关于订单的发票。虽然购买订单通常用于指示请求的产品和估计值或报价,但是发票通常用于指示实际提供的产品和该产品的最终价格。很多情况下,如订单的发票所展示的购买价格不同于如购买订单所展示的购买价格。作为一个实例,如果宾馆的客人初始地订购3晚住宿但第四晚结束住宿,那么购买订单的总价可反映不同于后续发票的总价。其中发票的总价不同于购买订单的总价的情况难以追踪,尤其是在每日接受许多订单的大型企业中(例如,给定国家的管理成百上千家宾馆的大型宾馆连锁店)。这些差异可引起企业的记录保存的错误。
由于商业机构越来越依赖技术来管理与发票和购买订单数据等操作相关的数据,用于适当地管理并收集数据的合适系统已变得对于成功至关重要。特别是对于大型商业机构,每日所用的数据量可能非常巨大的。因此,在最佳情况下,此类数据的人工审查和收集是不切实际的。
已有的一些解决方案用于自动地识别扫描文档(例如,发票和收据)或其它非结构化电子文档(例如,非结构化文本文件)中的信息。一些解决方案通常面临准确地辨识并识别电子文档的字符和其它特征的挑战。此外,在输入结构化电子文档的内容上的消减通常导致较高错误率。因此,现有图像识别技术在理想情况(即,非常清晰图像)下并非完全准确的,并且当输入图像较不清晰时,其精度通常显著地降低。此外,在数据的随后使用期间,丢失或其它不完整数据可导致错误。许多现有解决方案不可辨识丢失数据,除非例如结构化数据集中的字段保留不完整。
此外,现有图像识别解决方案不能够准确地辨识一些或所有特定字符(例如,“!”、“@”、“#”、“$”、“%”、“&”等)。作为一个实例,一些现有图像识别解决方案可将扫描的收据中所包括的虚线不精确地辨识为数字“1”。作为另一个实例,一些现有图像识别解决方案不可辨识特定字符,诸如美元符号、日元符号等。
另外,此类解决方案可面临将所识别信息准备用于随后使用的挑战。特别地,在输入电子文档特别地格式化以用于通过图像识别系统的识别的情况下,许多此类解决方案以未结构化格式产生输出,或可仅产生结构化输出。所得非结构化输出通常不可有效地处理。特别地,此类非结构化输出可包括副本,并且可包括在使用之前需要后续处理的数据。因此,企业通常雇佣会计事务所来手动地审查扫描收据和其它非结构化电子文档。然而,此类事务所通常为成本高昂的,并且仍容易出现人为错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瓦特博克有限公司,未经瓦特博克有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780030660.6/2.html,转载请声明来源钻瓜专利网。





