[发明专利]数据处理方法、装置、存储介质及电子设备有效
申请号: | 201810962547.8 | 申请日: | 2018-08-22 |
公开(公告)号: | CN110019172B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 江期武 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/248 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 电子设备 | ||
1.一种数据处理方法,其特征在于,包括:
根据选定的目标变量读取数据库;其中,所述数据库包括与目标变量相关的多个特征变量;
获取各个特征变量在不同取值或者不同取值范围内的目标变量取值情况,包括:
判断所述目标变量是否为二分变量;若判断结果为否,则将所述目标变量转换为二分变量;其中所述二分变量的取值包括目标值和非目标值;
判断各个特征变量是否为离散型变量或者连续型变量;
若判断所述特征变量为离散型变量,则获取所述离散型变量在不同取值下的目标值数量和非目标值数量;
若判断所述特征变量为连续型变量,则根据不同取值范围对所述连续型变量做分箱处理后,获取所述连续型变量在不同数据分箱内的目标值数量和非目标值数量;
根据所述目标变量取值情况,计算得到各个特征变量对于所述目标变量的预测价值,包括:
通过公式计算得到各个特征变量对于所述目标变量的预测价值;
其中,
根据所述预测价值生成差异化显示所述特征变量的可视化图表。
2.根据权利要求1所述的数据处理方法,其特征在于,在根据选定的目标变量读取数据库之后,所述方法还包括:
滤除所述特征变量中的噪声变量。
3.根据权利要求2所述的数据处理方法,其特征在于,所述滤除所述特征变量中的噪声变量包括:
获取各个特征变量的数据缺失率;
将所述数据缺失率超过预设阈值的特征变量记为噪声变量;
滤除所述特征变量中的噪声变量。
4.根据权利要求2所述的数据处理方法,其特征在于,所述滤除所述特征变量中的噪声变量包括:
根据所述目标变量设定过滤字段;
将包含所述过滤字段的特征变量记为噪声变量;
滤除所述特征变量中的噪声变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810962547.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算机大数据存储系统
- 下一篇:大数据的设备能效控制方法