[发明专利]风险模型训练方法、风险识别方法、装置、设备及介质有效
| 申请号: | 201810250156.3 | 申请日: | 2018-03-26 |
| 公开(公告)号: | CN108549954B | 公开(公告)日: | 2022-08-02 |
| 发明(设计)人: | 金戈;徐亮;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q10/08 |
| 代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 张美君 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 风险 模型 训练 方法 识别 装置 设备 介质 | ||
1.一种风险模型训练方法,其特征在于,包括:
对历史出行数据进行风险值标注,获取原始训练数据,所述历史出行数据包括出行时间、性别、年龄、查验情况和出行地点,所述历史出行数据包括低风险对象的历史出行数据和高风险对象的历史出行数据,所述原始训练数据包括所述历史出行数据和对应的风险值,所述风险值包括高风险值和低风险值;
对所述原始训练数据进行同行分析,获取同行特征,所述同行分析指对与已知高风险对象同时行动的群体的行为特征进行的专门分析,所述同行分析包括:
获取所有高风险值的原始训练数据对应的历史出行时间;
对所述历史出行时间进行区间划分,获取同行特征;
对所述原始训练数据进行口岸漂移分析,获取口岸漂移特征,所述口岸漂移分析是对运输对象在一定时间内是否会更改出行地点的分析,所述口岸漂移分析包括:
统计所有高风险值的原始训练数据在第一预设时间内的出行次数和地点变更次数,所述第一预设时间与所述同行特征的出行时间相同;
采用公式S=Y/X对所述出行次数和所述地点变更次数进行计算,获取口岸漂移特征;其中,Y为所述出行地点变更次数,X为所述出行次数;
基于所述同行特征和所述口岸漂移特征,获取中间训练数据;
对所述中间训练数据进行缺失值处理和离散变量编码,获取目标训练数据;按照第二预设时间对所述目标训练数据进行拆分,获取训练集和测试集,所述第二预设时间用于对所述目标训练数据进行分类;
采用决策树算法对训练集中的目标训练数据进行训练,获取原始风险模型;
采用测试集对所述原始风险模型进行测试,获取目标风险模型。
2.如权利要求1所述的风险模型训练方法,其特征在于,所述采用决策树算法对训练集中的目标训练数据进行训练,获取原始风险模型,包括:
初始化决策树算法对应的层级参数;
采用CART算法对训练集中的目标训练数据进行训练,在决策树的生长层数达到所述层级参数时,获取所述原始风险模型;
所述目标训练数据包括至少两个维度特征;
所述采用CART算法对训练集中的目标训练数据进行训练,在决策树的生长层数达到所述层级参数时,获取所述原始风险模型,包括:
采用公式和计算每一所述维度特征对应的基尼系数;其中,D为所述训练集,α为所述维度特征,Pk为所述维度特征的概率;
选取最小基尼系数对应的维度特征作为决策树的根节点;
基于所述决策树的根节点,重复执行计算维度特征所对应的基尼系数的步骤,直至决策树的生长层数达到层级参数的条件时,获取原始风险模型。
3.一种风险识别方法,其特征在于,包括:
获取待识别出行数据;
将所述待识别出行数据输入到所述目标风险模型进行识别,获取风险识别结果;
其中,所述目标风险模型是采用权利要求1-2任一项所述风险模型训练方法获取的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810250156.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





