[发明专利]分布式全链路自动化智能通关系统、方法及存储介质在审
申请号: | 202011399701.9 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112418812A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 张东峰;冯玉静;陆欢旺;万晓磊 | 申请(专利权)人: | 上海三稻智能科技有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q50/26;G06F40/183;G06F40/186;G06F40/30;G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 谢绪宁;薛赟 |
地址: | 200040 上海市静安区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 全链路 自动化 智能 通关 系统 方法 存储 介质 | ||
1.分布式全链路自动化智能通关方法,其特征在于,包括:
接收订单,接收订单数据信息、通关原始文件及口岸渠道信息;
基于订单数据信息、通关原始文件及预设的模板制单;
基于口岸渠道信息分配清关口岸,生成符合相应口岸数据格式的申报清单;
向海关服务器发送申报清单并接收海关服务器返回的回执单;
申报完成后,查询清关状态;
清关完成后对税费进行计算并缴纳;
其中,通关原始文件包括Excel文件和非Excel文件,当通关原始文件为非Excel文件时,基于订单数据信息、通关原始文件及预设的模板制单包括:
将非图片类通关原始文件转换为图片格式;
文件解析,解析通关原始文件类型及格式;
图像预处理,修正通关原始文件的图像成像问题;
文字检测,检测通关原始文件中文本的所在位置、范围及布局;
文字识别,在文本检测的基础上对文本内容进行识别;
文本提取,从文本识别结果中抽取需要的字段和/或要素;
当通关原始文件为Excel文件时,基于订单数据信息、通关原始文件及预设的模板制单包括:
匹配模板,上传通关原始文件,将通关原始文件依次与各模板进行匹配,选择有效数值匹配最多的模板;
文件解析,抓取通关原始文件中与模板匹配的数据。
2.根据权利要求1所述的分布式全链路自动化智能通关方法,其特征在于,所述图像预处理包括:
将通关原始文件的图像输入预先训练的图像校正网络中进行几何变化和/或畸变校正,得到校正后的第一目标图像;
将第一目标图像通过CV算法及仿射变换矩阵进行小角度校正,得到第二目标图像;
将第二目标图像通过去噪算法去除模糊,得到第三目标图像;
将第三目标图像经过二值化处理,得到二值化图像。
3.根据权利要求1所述的分布式全链路自动化智能通关方法,其特征在于,所述文字检测包括:
将二值化图像输入预先训练的特征提取网络中;
提取所述特征提取网络中至少两个卷积层的输出信息,并对所述输出信息进行融合;
将融合后的信息输入所述特征提取网络中的全连接层,输出对应于所述二值化图像文本区域的k个anchor的2k个竖直方向坐标及坐标得分、k个边界回归结果,以实现文本定位,并得到矩形文本框。
4.根据权利要求3所述的分布式全链路自动化智能通关方法,其特征在于,文字识别包括:通过预先训练的文字识别网络对矩形文本框内的文本内容进行字符识别,获取文本内容信息。
5.根据权利要求4所述的分布式全链路自动化智能通关方法,其特征在于,所述文本提取包括:
基于预先设置的语义数据库生成基础语义分析引擎,所述语义数据库中包括领域基础语料库、领域词典及领域知识图谱;
基于基础语义分析引擎对文本内容信息进行字段分析处理;
基于抽取需求提取数据集合抽取文本内容中需要的字段和/或要素。
6.根据权利要求1所述的分布式全链路自动化智能通关方法,其特征在于,包括预先设置模板,具体包括:
模板标注,包括:指定并标注所述模板对应的业务类型,以及标注所述模板的关键字,以区分及确定模板;
业务标注,对所述模板进行业务标注,包含关键字标注和循环体标注,以及对应的单元格、组合单元格、行表体和列表体元素的标签,所述循环体标注包括横向循环体标注及竖向循环体标注;
模板解析,包括:业务类型解析、业务字段解析及业务表体解析,所述业务字段解析包括关键字解析,所述业务表体解析包括横向循环体解析及竖向循环体解析,解析后保存至数据库。
7.根据权利要求6所述的分布式全链路自动化智能通关方法,其特征在于,所述文件解析具体包括:
对通关原始文件进行匹配解析,包括:业务类型解析、业务字段解析及业务表体解析,所述业务字段解析包括关键字解析,所述业务表体解析包括横向循环体解析及竖向循环体解析;
抓取通关原始文件中与所选模板匹配的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海三稻智能科技有限公司,未经上海三稻智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011399701.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理