[发明专利]一种具备模型预警更新机制的数据挖掘方法在审
申请号: | 201810327487.2 | 申请日: | 2018-04-12 |
公开(公告)号: | CN108509644A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 勇萌哲;普雪飞 | 申请(专利权)人: | 成都优易数据有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼 |
地址: | 611730 四川省成都市郫县德源镇(菁*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据挖掘 更新机制 业务目标 数据集 判定 预警 数据挖掘流程 标准流程 定义模型 建模分析 模型评估 数据理解 数据准备 行业数据 预警规则 重复执行 重新计算 更新 部署 挖掘 优化 | ||
1.一种具备模型预警更新机制的数据挖掘方法,其特征在于:包括如下步骤:
步骤1:商业理解获得业务目标初步方案并根据业务目标定义模型失效判定原则;
步骤2:基于初步方案依次进行数据理解和数据准备获得适于建模分析的数据集;
步骤3:基于数据集和失效判定原则,根据实际业务场景训练多个模型完成模型的建立和优化;
步骤4:对建立好的多个模型进行模型评估和初步部署后判断其是否满足预警规则需要更新,若满足,则重新计算模型完成更新后跳至步骤5;若不需要,则直接跳至步骤5;
步骤5:进行模型最终部署完成数据挖掘。
2.根据权利要求1所述的一种具备模型预警更新机制的数据挖掘方法,其特征在于:所述步骤4包括如下步骤:
步骤4.1:对建立好的多个模型进行模型评估和初步部署;
步骤4.2:将测试数据输入完成评估的模型中获得模型性能的评估指标;
步骤4.3:判断模型性能的评估指标是否满足预设的失效判定原则,若满足,则重新计算模型选择多个模型中的备用模型完成更新跳至步骤5;若不满足,则直接跳至步骤5。
3.根据权利要求1所述的一种具备模型预警更新机制的数据挖掘方法,其特征在于:所述步骤4.2包括如下步骤:
步骤4.2.1:选择测试数据中对应的输入数据作为标签字段进行测试后根据公式1计算正确分类率accuracy,公式1如下:
其中,ncorrect被正确分类的样本数,ntotal总样本数;
步骤4.2.2:根据公式2计算针对标签字段特定取值的准确率和召回率,则正例的正确率Precision计算如公式2所示:
召回率Recall计算如公式3所示:
其中,TP为真正例即实际为正例,预测为正例,FP是假正例即实际为负例,预测为正例;FN表示实际为正例,被模型预测为负例的样本;
步骤4.2.3:基于步骤4.2.2计算真正例率TPR如公式4所示、假正例率FPR如公式5所示和真负例率TNR如公式6所示后画ROC曲线图求得AUC值,计算公式如下:
其中,FN表示实际为正例,被模型预测为负例的样本;TN表示实际为负例,被模型预测为负例的样本,AUC值为ROC曲线面积,ROC曲线是受试者特征曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都优易数据有限公司,未经成都优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810327487.2/1.html,转载请声明来源钻瓜专利网。