[发明专利]车险理赔行为识别方法、装置、设备及存储介质有效
| 申请号: | 202110635315.3 | 申请日: | 2021-06-08 |
| 公开(公告)号: | CN113256434B | 公开(公告)日: | 2021-11-23 |
| 发明(设计)人: | 朱磊;徐赛奕;张霖;俞丽娟;朱艳乔 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06K9/62 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 车险 理赔 行为 识别 方法 装置 设备 存储 介质 | ||
本发明涉及大数据领域,公开了一种车险理赔行为识别方法、装置、设备及存储介质。该方法包括:将历史车险理赔数据划分为正样本和负样本,近邻处理正样本得到扩充样本,下采样负样本得到子样本;将子样本分别与正样本和扩充样本组合,得到第一、第二数据集并输入行为识别模型进行识别,得到第一、第二行为识别结果,以此计算行为识别模型的误分率和第一、第二识别结果的相对熵损失;根据误分率和相对熵损失对行为识别模型进行更新,直到行为识别模型收敛时停止;最后将待识别车险理赔数据输入行为识别模型,识别待识别车险理赔数据对应的行为类别。本发明解决了车险反欺诈的数据集存储正负样本不平衡的情况,从而提升车险赔付异常识别的准确度。
技术领域
本发明涉及大数据领域,尤其涉及一种车险理赔行为识别方法、装置、设备及存储介质。
背景技术
车险是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险,汽车保险是伴随着汽车的出现和普及而产生和发展的。随着社会的发展,人民的生活质量提高,买车的人越来越多,但是有一部分违法分子通过办理车险,伪造事故现场,骗取保险公司的理赔金,诈骗的手段越来越多,骗保事件频发,尤其是针对车险这个领域,骗保的手段层出不穷,花样繁多,让车险公司随时惨重,骗保人员多以团伙作案,联合汽车维修公司甚至买通定损人员进行骗保。
现有车险反欺诈的数据集中,由于车险欺诈的行为相对于正常赔付行为仍为少数,即在采用数据集进行机器学习以鉴定车险赔付是否异常时,欺诈行为的案例和正常赔付行为的案例不平衡,导致正负样本的数量不平衡,在这种情况下,如果使用一般的机器学习的建模方法,得到的效果会非常差,模型会迎合数据的特点,倾向于把结果判断为样本数多的一类。即现有车险反欺诈的数据集存储正负样本不平衡的情况,导致车险赔付异常识别的模型训练准确度低。
发明内容
本发明的主要目的在于解决现有车险反欺诈的数据集存储正负样本不平衡的情况,导致车险赔付异常识别的模型训练准确度低的问题。
本发明第一方面提供了一种车险理赔行为识别方法,包括:获取历史车险理赔数据,并将所述历史车险理赔数据划分为正样本和负样本;对所述正样本进行近邻传播处理,得到多个扩充样本,以及对所述负样本进行下采样处理,得到多个子样本;将每个所述子样本分别与所述正样本和所述扩充样本进行组合,得到第一数据集和第二数据集;将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别,得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果;根据所述第一行为识别结果和所述第一数据集对应的行为类型,计算所述行为识别模型对所述第一数据集的误分率,以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失;根据所述误分率和所述相对熵损失对所述行为识别模型进行更新,直到所述行为识别模型收敛时停止;获取待识别车险理赔数据,并将所述待识别车险理赔数据输入所述行为识别模型,识别所述待识别车险理赔数据对应的行为类别。
可选的,在本发明第一方面的第一种实现方式中,所述对所述正样本进行近邻传播处理,得到多个扩充样本包括:依次计算每两个正样本之间的欧式距离,并根据所述欧式距离,确定每个正样本的近邻样本;随机筛选预置数量的近邻样本进行线性插值处理,并根据处理的结果构造扩充样本。
可选的,在本发明第一方面的第二种实现方式中,所述将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别,得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果包括:将数据集分别输入至预置的行为识别模型中,其中,所述行为识别模型包括输入层和决策层,所述数据集包括所述第一数据集和所述第二数据集;通过所述输入层对所述数据集进行随机采样处理,得到多个特征子集;将各所述特征子集输入所述决策层中不同的学习器,并通过所述学习器对各所述特征子集进行识别,输出各所述学习器对对应特征子集的识别结果;根据各所述学习器输出的识别结果,确定所述行为识别模型对所述数据集的识别结果,其中,所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110635315.3/2.html,转载请声明来源钻瓜专利网。





