[发明专利]智能核保方法与系统在审
| 申请号: | 201811216477.8 | 申请日: | 2018-10-18 |
| 公开(公告)号: | CN109410074A | 公开(公告)日: | 2019-03-01 |
| 发明(设计)人: | 邓健爽 | 申请(专利权)人: | 广州市勤思网络科技有限公司 |
| 主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06K9/62 |
| 代理公司: | 佛山帮专知识产权代理事务所(普通合伙) 44387 | 代理人: | 颜德昊 |
| 地址: | 510006 广东省广州市番禺区小*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 投保 核保 分类模型 随机森林 用户数据 智能 训练数据 决策树 保险领域 保险业务 工作效率 客户资料 人力成本 使用数据 随机采样 特征提取 数据处理 审核 样本 体检 输出 客户 重复 决策 | ||
1.一种智能核保方法,其特征在于,包括:
步骤1,获取投保用户包括体检数据在内的用户数据,进行数据处理和特征提取;
步骤2,对用户数据的i个样本进行随机采样并重复k次,形成k份训练数据;
步骤3,根据k份训练数据构造CART决策树;
步骤4,根据若干个相互独立的决策树构造随机森林分类模型;
步骤5,在保险业务系统中导入随机森林分类模型,输入投保用户的用户数据并获得模型输出的投保建议。
2.如权利要求1所述智能核保方法,其特征在于,步骤1包括:
步骤11,获取投保用户包括体检数据在内的用户数据;
步骤12,通过离散化方法对用户数据中的多个连续特征进行离散处理;
步骤13,通过归一化方法对连续型特征进行无量纲化处理;
步骤14,通过哑编码方法将定性特征转换为定量特征。
3.如权利要求2所述智能核保方法,其特征在于,步骤2包括:通过自助法对用户数据的i个样本进行随机采样并重复k次,形成k份训练数据。
4.如权利要求3所述智能核保方法,其特征在于,步骤3包括:
步骤31,确定分类标记集合;
步骤32,依据训练数据建立节点N;
步骤33,根据分类标记集合将属于同一个类的训练数据对应的节点标记出所属的类;
步骤34,将特征集为空的训练数据对应的节点依据少数服从多数的原则标记出所属的类;
步骤35,从M个特征中随机选m个特征以基尼系数最小的特征作为节点的分裂特征;其中,M表示特征集为空的训练数据的特征数量,m=sqrt(M)且满足条件m<<M;
步骤36,对分裂特征中的每个值,从N生成一个分支,将训练数据中与该分支有关的数据收集形成分支节点的训练数据,并删除分支节点对应的节点特征;
步骤37,若步骤36的分支训练数据中的特征非空,则转到步骤31从该分支节点建立子树。
5.如权利要求4所述智能核保方法,其特征在于,步骤4包括:由若干个相互独立的决策树构造随机森林分类模型,在每个决策树中对输入的数据进行投票,对投票结果进行统计并将得票数最多的分类结果作为模型的最终输出。
6.一种智能核保系统,其特征在于,包括:
数据处理模块,用于获取投保用户包括体检数据在内的用户数据,进行数据处理和特征提取;
随机采样模块,用于对用户数据的i个样本进行随机采样并重复k次,形成k份训练数据;
决策树构造模块,用于根据k份训练数据构造CART决策树;
随机森林模块,用于根据若干个相互独立的决策树构造随机森林分类模型;
核保模块,用于在保险业务系统中导入随机森林分类模型,输入投保用户的用户数据并获得模型输出的投保建议。
7.如权利要求6所述智能核保系统,其特征在于,数据处理模块包括:
数据获取单元,用于获取投保用户包括体检数据在内的用户数据;
离散处理单元,用于通过离散化方法对用户数据中的多个连续特征进行离散处理;
归一化单元,用于通过归一化方法对连续型特征进行无量纲化处理;
哑编码单元,用于通过哑编码方法将定性特征转换为定量特征。
8.如权利要求7所述智能核保系统,其特征在于,随机采样模块具体用于通过自助法对用户数据的i个样本进行随机采样并重复k次,形成k份训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市勤思网络科技有限公司,未经广州市勤思网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811216477.8/1.html,转载请声明来源钻瓜专利网。





