[发明专利]基于结构化文档的报文入库方法及装置在审
| 申请号: | 202011636713.9 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112785284A | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 周国威;娄芳 | 申请(专利权)人: | 银清科技有限公司 |
| 主分类号: | G06Q20/08 | 分类号: | G06Q20/08;G06F40/143 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;周永君 |
| 地址: | 100195 北京市海淀区北坞村*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 结构 文档 报文 入库 方法 装置 | ||
本申请提供的一种基于结构化文档的报文入库方法及装置,本发明省去了大量的手工工作和缩减了工作流程,提高了报文维护前期入库准备的效率;其次,与文档直接提取为数组和链表相比,树结构更易于裁剪和嫁接,解决当X(=几十至上百)个报文类型新增或更新时,根据一个报文类型载体,组装为相同报文类型报文主体结构但组合不同明细、附加域以验证一笔至多笔明细、不同业务类型和业务种类等业务场景验证;特别是,当几十个报文结构对应相同业务种类但不同业务类型时,抽出相同业务种类报体结构,或标注可重复循环的单元结构等,提高了报文组装发送时用户定制组装报文结构,提高报文在业务验证阶段的高效和灵活性。
技术领域
本申请涉及数据处理技术领域,特别涉及人工智能技术领域,具体涉及基于结构化文档的报文入库方法及装置。
背景技术
在中国第二代支付系统(CNAPS)、支付报文传输平台中,各商业银行参与者、第三方组织支付清算系统以及各业务平台进行业务交互的报文消息是使用可扩展标记语言(XML)格式进行收发和业务处理。这里,一代支付系统的报文格式有CMT和PKG。在应对二代支付系统中系统调整、新增业务平台接入等需求时,相应的报文格式标准文档将修订新增、调整的报文类型和业务描述等,所述报文格式标准规定了每个业务交易对应的往来报文类型。
在研发测试过程中,如图1所示,需根据提供的报文格式标准将这类业务的受理数据组装成可扩展标记语言(XML)报文或CMT格式报文发送到模拟测试环境中测试。正是基于这类测试业务的需求,开发了一种将报文格式标准文档转换为基于可扩展标记语言(XML)和CMT格式报文结构元素集,导入数据库表的方法。这种方法有效的提高了工作效率,例如,解放了繁琐的可扩展标记语言(XML)、CMT报文元素手工录入,缩减了开发阶段频繁调整带来报文结构校对的时间过程。根据新增相应的子系统类型,导入报文格式标准和对应的概述文档文件,就能入库报文结构数据信息,通过页面维护出相应的基于可扩展标记语言(XML)和CMT报文结构。
开发此方法用到的技术是Java技术以及“基于Apache POI提供的API对MicrosoftOffice格式文档”的解析技术。通过本专利的转换方法,可以将多个报文类型,其中报文类型由几十到上百个标签对象组成,组织成基于可扩展标记语言(XML)报文结构视图,入库存储。
发明内容
为解决上述技术问题,本申请提供以下技术方案:
第一方面,一种基于结构化文档的报文入库方法,包括:
读取待入库报文;
根据一预设模板文件的元素结构提取所述待入库报文对应每个元素结构的表格内容,得到元素结构集合;所述预设模板文件为树型结构;
根据提取的元素结构集合进行报文入库。
在优选的实施例中,还包括:
配置所述预设模板文件。
在优选的实施例中,配置所述预设模板文件,包括:
配置所述预设模板文件的元素结构和树型结构内容;其中,所述元素结构为层级结构,每个层级为所述预设模板文件的其中一个节点;
根据实际业务需求配置每个节点和表格的属性。
在优选的实施例中,所述元素结构为层级结构,每个层级作为所述树型结构的其中一个节点;
所述根据一预设模板文件的元素结构提取所述待入库报文对应每个元素结构的表格内容,包括:
加载所述预设模板文件,并遍历其中的所有节点;
根据每个节点的类型以对应每种节点类型的加载方式加载每个节点;
根据加载的节点提取得到所述元素结构集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银清科技有限公司,未经银清科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011636713.9/2.html,转载请声明来源钻瓜专利网。





