[发明专利]一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质有效
申请号: | 202110232188.2 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112966131B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 王正刚;刘伟;金瑾 | 申请(专利权)人: | 中华人民共和国成都海关;中科院成都信息技术股份有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/55;G06F16/583;G06K9/62;G06N3/04;G06Q50/26 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 杨国瑞 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海关 数据 类型 识别 方法 智能化 风险 布控 装置 计算机 设备 存储 介质 | ||
本发明涉及数据挖据技术领域,公开了一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质。在所述方法中,首次提出运用智能化手段处理海关报关数据,即在通过对海量海关数据记录信息的样本处理和BF‑net模型训练后,可以实现单条待检海关数据的输入,并自动判断风控类型,从而大大降低了风险分析人员由于个体经验差异造成的不同标准的风险布控执法工作,同时大大提升海关风险分析人员的布控效率和精准度,能够精准的布控高风险商品和违规违法商品,降低口岸现场查验工作人员的查验压力,大大提升口岸高风险商品和违规违法商品的查获率,进而可节省海关口岸现场的查验人力资源,实现进口商品精准布控查验。
技术领域
本发明属于数据挖据技术领域,具体地涉及一种海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质。
背景技术
目前,对于海关总署和各省直属海关层面的风险分析部门而言,所采用的数值分析、图表分析和模型对比等传统的人工风险排查模式,在时效性和准确性方面均很难达到快捷通关和风险布控的要求。即一方面在整个流程中数据共享存在壁垒,没有实现大数据的共享,导致无法全面判断货物贸易的整体风险;另一方面是人工分析判断存在以下不足:一是人与人之间的差异会不可避免的掺杂人为因素,无法做到统一标准实施风险布控;二是需要从事风险判别的关员具备丰富的风险分析经验,以保证货物查验的查获率;三是人工判别效率不高,下达布控指令和现场查验均无法保持高效。
另外,当今国际贸易呈现交易碎片化的特点,需要海关风险布控工作及时适应,即由于具有数量大、单项数量小、由不同的供货商和采购者拼箱拼单等种种特点,导致审核必须单单相符和单证相符,以及要求品名规格数量一一对应和绝对精确,但是这些都不切实际且效能低下。近年来,快件邮件数量急剧增加,单多货杂和拼箱货多的特点导致走私夹藏风险非常高,对收集企业、商品和交易等信息的深度和广度以及风险分析的精准度提出很大挑战。
虽然当前也存在运用传统机器学习的方式(例如决策树或随机森林等树状结构算法)对海关表单数据进行风险判别类型的分类处理,但是传统机器学习的方法存在以下几个方面的技术缺陷:(1)决策树模型容易产生一个过于复杂的模型,这样的模型对数据的泛化性能会很差;(2)决策树可能是不稳定的,因为在数据中的微小变化可能会导致完全不同的树生成;(3)如果某些类在问题中占主导地位,会使得创始的决策树有偏差;(4)对于有不同取值的属性的数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的。
发明内容
为了解决当前基于人工分析方式及运用传统机器学习方式对海关表单数据进行风险判别所存在效率低下和精准度有限的问题,本发明目的在于提供一种基于卷积神经网络CNN的海关数据风控类型识别方法、海关智能化风险布控方法、装置、计算机设备及存储介质,相比于现阶段全国海关数值分析、图表分析和模型对比等人工风险分析布控作业方式,不仅提高了效率,而且大大提高了风险布控的精准度和口岸违法商品的查获率,进而可节省海关口岸现场的查验人力资源,实现进口商品精准布控查验。
第一方面,本发明提供了一种海关数据风控类型识别方法,包括识别模型训练阶段和风控类型识别阶段;
所述识别模型训练阶段,包括有如下步骤S101~S106:
S101.获取M条海关数据记录信息,其中,所述海关数据记录信息包含有查验结果代码和与N个数据项一一对应的N个数据内容,M为不小于3000的自然数,N为不小于64的自然数;
S102.针对所述N个数据项中的各个数据项,对相应的M个数据内容进行去重处理,然后对得到的至少一个数据内容进行索引编号,得到相应的数据字典,其中,所述数据字典记录有所述至少一个数据内容与至少一个索引值的一一对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中华人民共和国成都海关;中科院成都信息技术股份有限公司,未经中华人民共和国成都海关;中科院成都信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110232188.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置