[发明专利]一种税务系统的智能风险识别方法在审
申请号: | 202110492273.2 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113191868A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 蒋莎莹;张涛 | 申请(专利权)人: | 江苏索迩软件技术有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06Q10/06 |
代理公司: | 重庆壹手知专利代理事务所(普通合伙) 50267 | 代理人: | 刘军 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 税务系统 智能 风险 识别 方法 | ||
本发明公开了一种税务系统的智能风险识别方法,数据选取,首先对税务数据根据业务域进行划分,大体分为如下:申报数据、申请数据、发票数据、登记信息数据。本发明所述的一种税务系统的智能风险识别方法,通过算法进行数据处理,只需设置处理规则算法即可对数据进行批量处理,无需人为干预,通过税务大数据分析特征相关性,穷尽所有数据关系,无需更新任何指标,根据行业、地区分别建立分析模型,无需针对每个行业或地区再做数据特殊化处理,根据税务大数据分析出不同情况下的数据特征,通过算法处理并分析数据,可以穷尽所有数据可能,风险应对结果可对模型训练进行补充,实现模型自动迭代。
技术领域
本发明涉及风险识别领域,具体涉及一种税务系统的智能风险识别方法。
背景技术
税务系统是一种用于监测纳税人、企业、个体户纳税情况,当前税务系统风险识别的主要方式是通过设置税务指标并设置阈值来筛选可能的风险纳税人;
但是现有的税务系统的智能风险识别方法虽然符合业务规律,但是存在着一下不足:
1、税务数据十分庞大且复杂,数据加工耗时耗力;
2、税务业务日新月异经常更新,导致涉及指标需要不断更新;
3、各地区各行业针对每个指标风险敏感度不同,需要根据不同地区不同行业不同时间段设置不同的值,导致指标系统尤为复杂;
4、设置指标是建立在税务人员经验基础之上,无法穷尽所有风险可能;5、风险应对结果对指标体系的建立没有建立反馈机制。
发明内容
本发明的主要目的在于提供一种税务系统的智能风险识别方法,可以有效解决背景技术中:现有的税务系统的智能风险识别方法虽然符合业务规律,但是存在着税务数据十分庞大且复杂,数据加工耗时耗力;税务业务日新月异经常更新,导致涉及指标需要不断更新;各地区各行业针对每个指标风险敏感度不同,需要根据不同地区不同行业不同时间段设置不同的值,导致指标系统尤为复杂;设置指标是建立在税务人员经验基础之上,无法穷尽所有风险可能;风险应对结果对指标体系的建立没有建立反馈机制的不足之处。
为实现上述目的,本发明采取的技术方案为:
一种税务系统的智能风险识别方法,该方法具体包括如下步骤:
步骤一:该方法具体包括如下步骤:
步骤一:数据选取,首先对税务数据根据业务域进行划分,大体分为如下:申报数据、申请数据、发票数据、登记信息数据;
步骤二:数据初加工,剔除掉无效字段,如:各类人员代码等,进行统一、格式化的数据初加工;
步骤三:数据清洗,通过各类算法对数据进行各类处理,如:空值处理与填充、常量值处理、标准化处理、离群点处理,把所有无效数据近一步处理;
步骤四:特征工程,对数据进行有效解析,如:离散特征编码、离散化、相关性分析、组合特征、主成分分析;
步骤五:聚类分析,对所有代表纳税人特征的数据项进行聚类分析,根据唯一标识符进行聚类,然后根据聚类结果进行数据重新分析。
作为本发明的进一步方案,所述步骤一中:
申报数据包括:企业所得税申报数据、增值税申报数据、财务报表申报数据、以及其他各类税种申报表数据,每个税种的申报表分为主表和多张附表,主表和多张附表延伸出数据分叉;
申请数据为根据各类申请事项区分各自不同的业务表和关联方式;
发票数据是根据销货方与购货方的发票开具记录、税额、份数、销售额等等再细分;
登记数据区分为税务登记信息、各类资格信息等,税务登记信息、各类资格信息再细分为基础数据和各类变更记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏索迩软件技术有限公司,未经江苏索迩软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110492273.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:机械车库用汽车托盘的移动转接装置
- 下一篇:一种基于消防物联网的监控管理系统