[发明专利]风险数据筛选方法、装置、计算机设备和存储介质在审
申请号: | 201811183701.8 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109523118A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 张翔;周欣欣;汪伟;肖京;高舒 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险数据 风险因子 风险评估结果 计算机设备 存储介质 筛选 风险评估模型 初步筛选 二次筛选 金融行业 所属数据 无效数据 大数据 预设 申请 应用 | ||
本申请涉及大数据技术领域,应用于金融行业,提供了一种风险数据筛选方法、装置、计算机设备和存储介质。方法包括:根据获取的风险数据的所属数据类别,确定风险数据指标的组成风险因子,获得风险数据指标,将多个风险数据指标分别输入预设风险评估模型,获取风险评估结果差异大于设定范围的风险数据指标组合,并将风险数据指标组合对应的风险数据的比较,确定有效风险因子,对风险数据进行筛选。通过风险数据类别,确定风险数据指标的组成风险因子,对风险数据进行了初步筛选得到风险数据指标,根据多个风险数据指标的风险评估结果,确定有效风险因子,实现了对风险数据的二次筛选,进而提高了风险数据的有效性,避免无效数据干扰风险评估结果。
技术领域
本申请涉及大数据技术领域,特别是涉及一种风险数据筛选方法、装置、计算机设备和存储介质。
背景技术
随着企业多元化以及国际经营化的发展,越来越多的企业,对于企业自身的风险管控和预警日益看重,由于有效的风险预警有利于降低企业风险,减少利益损失。传统的风险预警方法是根据研究对象的特点,通过收集相关资料信息,监控风险信号的变化趋势,并评价各种风险状态偏离预警阈值的强弱程度,向决策层发出预警信号并提前采取对策的系统。这些方法的核心技术通常为专家规则或机器学习算法。
然而,传统的机器学习算法在进行风险数据筛选时往往是依据行业经验,筛选得到的风险数据中可能存在部分无效数据,干扰风险预测结果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高数据有效性的风险数据筛选方法、装置、计算机设备和存储介质。
一种风险数据筛选方法,所述方法包括:
获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;
根据所述风险数据和所述组成风险因子,获得所述风险数据指标;
将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;
比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;
根据所述有效风险因子,对所述风险数据进行筛选。
在其中一个实施例中,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子包括:
获取正样本的风险数据和负样本的风险数据,根据所述风险数据的所属数据类别,对所述风险数据进行分类;
根据预设的评价参数,评价各类别的所述风险数据对于正样本和负样本的区分度;
根据所述区分度评价结果,确定所述风险数据指标的组成风险因子。
在其中一个实施例中,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子之前,还包括:
获取待处理数据,对所述待处理数据进行数据格式的归一化处理;
对经过数据格式的归一化处理的所述待处理数据进行数据清洗,获得清洗数据;
对所述清洗数据进行衍生计算处理,获得衍生数据;
根据预设阈值范围,对所述清洗数据和所述衍生数据进行筛选,确定所述风险数据。
在其中一个实施例中,所述获取待处理数据,对所述待处理数据进行数据格式的归一化处理包括:
获取所述待处理数据划中的非结构化待处理数据,对所述非结构化待处理数据进行关键字提取和/或主题提取;
根据提取结果,将所述非结构化待处理数据转换为结构化数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811183701.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理