[发明专利]一种税务系统的智能风险识别方法在审
申请号: | 202110492273.2 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113191868A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 蒋莎莹;张涛 | 申请(专利权)人: | 江苏索迩软件技术有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06Q10/06 |
代理公司: | 重庆壹手知专利代理事务所(普通合伙) 50267 | 代理人: | 刘军 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 税务系统 智能 风险 识别 方法 | ||
1.一种税务系统的智能风险识别方法,其特征在于:该方法具体包括如下步骤:
步骤一:数据选取,首先对税务数据根据业务域进行划分,大体分为如下:申报数据、申请数据、发票数据、登记信息数据;
步骤二:数据初加工,剔除掉无效字段,如:各类人员代码等,进行统一、格式化的数据初加工;
步骤三:数据清洗,通过各类算法对数据进行各类处理,如:空值处理与填充、常量值处理、标准化处理、离群点处理,把所有无效数据近一步处理;
步骤四:特征工程,对数据进行有效解析,如:离散特征编码、离散化、相关性分析、组合特征、主成分分析;
步骤五:聚类分析,对所有代表纳税人特征的数据项进行聚类分析,根据唯一标识符进行聚类,然后根据聚类结果进行数据重新分析。
2.根据权利要求1所述的一种税务系统的智能风险识别方法,其特征在于:所述步骤一中:
申报数据包括:企业所得税申报数据、增值税申报数据、财务报表申报数据、以及其他各类税种申报表数据,每个税种的申报表分为主表和多张附表,主表和多张附表延伸出数据分叉;
申请数据为根据各类申请事项区分各自不同的业务表和关联方式;
发票数据是根据销货方与购货方的发票开具记录、税额、份数、销售额等等再细分;
登记数据区分为税务登记信息、各类资格信息等,税务登记信息、各类资格信息再细分为基础数据和各类变更记录。
3.根据权利要求1所述的一种税务系统的智能风险识别方法,其特征在于:所述步骤二中,数据初加工具体步骤为:
步骤1:先人为剔除一些无效字段;
步骤2:将数据格式进行统一,加工成每户一条的格式化数据;
步骤3:每一户都可以筛选出上千维数据,便于下一步的数据清洗。
4.根据权利要求1所述的一种税务系统的智能风险识别方法,其特征在于:所述步骤三中:
空值处理与填充的方式是先统一计算所有特征的空值率,如果空值率过高,我们选择剔除此类无效特征,根据空值率的不同和数据格式的不通进行不同操作方式的数据填充;
常量值处理的方式是统计每个特征对应实际数值,如果某个特征对应所有数值基本上全部相等或超过95%相等,即可选择剔除此列特征;
标准化处理的方式是通过标准化处理对数据进行统一格式的转换,避免由于数据差值过大等原因对结果有不可逆的影响;
离群点处理是避免由于部分数据的偏离而对结果有误导影响。
5.根据权利要求1所述的一种税务系统的智能风险识别方法,其特征在于:所述步骤四中:
离散特征编码,是对数据类型的区分和转换,由于数据类型多且复杂,有数值型、字符型、码值等,不同的数据格式我们需要用不同的处理方式进行转换,将数据类型转换为统一格式;
离散化,是指根据数据的离散程度进行一定程度的切片处理,根据数据的分布情况和数据情况再进行相对应的转换,避免由于数据的偏离度过高或过低而对结果有偏差;
相关性分析,是在大数据的视角下计算所有特征两两之间的相关度,根据相关度的高或低再进行不同的数据处理;
组合特征,是指将处理后的特征进行一定程度的扩维,通过算法计算扩维后的数据,使其拟合后续算法线性;
主成分分析,是指在扩维的基础上进行重要特征的提取,保留更为重要的特征。
6.根据权利要求1所述的一种税务系统的智能风险识别方法,其特征在于:所述步骤五中,聚类分析建立在所有处理完的数据之上,在每一户纳税人所有维度数据相关性的基础上进行户与户的聚类,根据聚类结果再计算户与户之间的距离和覆盖关系,并在其中标注风险户与未知风险户,根据风险户与未知风险户的聚类情况和距离、覆盖关系判断风险的可能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏索迩软件技术有限公司,未经江苏索迩软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110492273.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:机械车库用汽车托盘的移动转接装置
- 下一篇:一种基于消防物联网的监控管理系统