[发明专利]一种基于GLM及机器学习算法的车险纯风险保费预测方法及装置在审
| 申请号: | 202211158490.9 | 申请日: | 2022-09-22 |
| 公开(公告)号: | CN115578205A | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 赵昕 | 申请(专利权)人: | 上海七炅信息科技有限公司 |
| 主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06Q10/04;G06Q30/0283;G06F18/214;G06N20/20 |
| 代理公司: | 上海天之健律师事务所 31351 | 代理人: | 刘龙彦 |
| 地址: | 200085 上海市虹*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 glm 机器 学习 算法 车险 风险 保费 预测 方法 装置 | ||
1.一种基于GLM及机器学习算法的车险纯风险保费预测方法,其特征在于,包括:
步骤S1:采集第一建模因子的第一定价数据形成第一模型样本集,使用所述第一模型样本集拟合第一层GLM模型,计算预测结果残差;
步骤S2:在所述第一定价数据的基础上,采集第二建模因子;将所述第二建模因子的定价数据关联至所述第一定价数据,形成第二定价数据,并将第二定价数据作为第二模型样本集,将所述第二模型样本集进行处理后拟合第二层XGBoost残差模型,并将残差的预测结果进行切分,切分后的每组数据作为梯度提升分因子;
步骤S3:将所述梯度提升分因子、第三定价数据作为第三模型样本集拟合第三层GLM模型,计算并输出纯风险保费预测值。
2.根据权利要求1所述的基于GLM及机器学习算法的车险纯风险保费预测方法,其特征在于,所述步骤S1包括:
S11:采集第一建模因子的第一定价数据和对应的第一纯风险保费形成第一模型样本集;其中所述第一建模因子包含从车信息、从人信息、平台信息、保单信息;
S12:对所述第一模型样本集进行预处理,生成符合GLM模型要求的第一样本数据;
S13:使用所述第一样本数据拟合第一层GLM模型;
S14:在第一层GLM模型中输入所述第一定价数据,处理后,输出第一纯风险保费预测值;
S15:通过所述纯风险保费预测值计算预测结果残差;所述第一预测结果残差=纯风险保费实际值-纯风险保费预测值。
3.根据权利要求1或2所述的基于GLM及机器学习算法的车险纯风险保费预测方法,其特征在于,所述步骤S2包括:
S21:在所述第一定价数据的基础上,采集第二建模因子;将所述第二建模因子的定价数据关联至所述第一定价数据,形成第二定价数据,并将第二定价数据作为第二模型样本集;其中第二建模因子包含从车信息、从人信息、平台信息、保单信息、高维从车信息;
S22:对所述第二模型样本集进行预处理,生成符合XGBoost残差模型的第二样本数据;
S23:使用分层随机抽样的方法将所述第二定价数据与第一预测结果残差划分为训练集、验证集和测试集;所述训练集、验证集和测试集划分比例为6:2:2;
S24:使用所述训练集数据拟合XGBoost残差模型,使用所述验证集数据调整XGBoost残差模型训练过程中的超参,使用所述测试集数据测试训练完毕的XGBoost残差模型预测准确性;
S25:使用步骤S33拟合的第二层XGBoost残差模型对纯风险保费残差进行预测,再第二层XGBoost残差模型中输入所述第二定价数据,处理后,输出第二纯风险保费残差预测值;
S26:对所述第二纯风险保费残差预测值进行排序,将排序后的第二纯风险保费残差预测值按照N等分进行切分,并将切分后的每组第二纯风险保费残差预测值依序赋予1到N的值,作为新的风险因子标签——梯度提升分。
4.根据权利要求3所述的基于GLM及机器学习算法的车险纯风险保费预测方法,其特征在于,所述步骤S3包括:
S31:将梯度提升分因子加入至第一层GLM模型建模因子中,构成第三层GLM模型入模风险因子列表,并采集所述第三建模因子的第三定价数据与对应的第三纯风险保费,形成第三样本集;所述第三建模因子包含从车信息、从人信息、平台信息、保单信息、风险因子标签;
S32:使用第三样本集拟合第三层GLM模型,得到风险预测模型;
S33:在所述第三层GLM模型中输入第三定价数据,输出对应的第三纯风险保费预测值。
5.根据权利要求2所述的基于GLM及机器学习算法的车险纯风险保费预测方法,其特征在于,所述步骤S12包括:
数据清洗,处理第一模型样本集的空缺值、噪声数据,删除第一模型样本集的重复值;
数据集成,集成多个数据源,处理数据源的冗余问题;
特征工程:将步骤S121中处理后的第一样本数据连续变量分桶,类别变量编码,形成第一样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海七炅信息科技有限公司,未经上海七炅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211158490.9/1.html,转载请声明来源钻瓜专利网。





