[发明专利]风险标签处理方法及装置和电子设备在审
申请号: | 201910095194.0 | 申请日: | 2019-01-31 |
公开(公告)号: | CN110020663A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 张慧南;沈磊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 目标信息 客户端 标签处理 电子设备 标签表示 标签确定 风险识别 目标业务 训练目标 样本输入 业务模型 标注 | ||
本说明书实施例提供一种风险标签处理方法及装置和电子设备,所述方法包括:将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
技术领域
本说明书实施例涉及互联网技术领域,尤其涉及一种风险标签处理方法及装置和电子设备。
背景技术
随着机器学习技术的不断发展,越来越多业务场景采用机器学习技术训练得到的模型进行业务处理。例如通过风险识别模型,可以识别业务的目标信息是否存在风险。
通常,风控模型最重要的指标是风险识别的准确率,只有在模型准确率达到预设要求的情况下,该模型才可以上线使用;并且准确率越高,目标模型对业务处理的结果越好,被投诉的几率越低。
现有技术中,风控模型的准确率主要与训练样本的质量呈正相关。这里训练样本的质量一般是指样本的风险标签。只有在大量高质量标签的训练样本支持下,才可以训练出准确率高的业务模型。然而,现有样本的风险标签质量良莠不济,无法提供大量高质量标签的训练样本,以供模型训练。
发明内容
本说明书实施例提供的一种风险标签处理方法及装置和电子设备:
根据本说明书实施例的第一方面,提供一种风险标签处理方法,所述方法包括:
将目标信息发送给多个客户端,并收集所述多个客户端针对该目标信息标注的风险标签;其中,所述风险标签表示客户端对目标信息进行风险识别得出的风险结果;
计算所收集到的风险标签中相同风险标签的数量,并将达到阈值的风险标签确定为共识风险标签;
将所述具有共识风险标签的信息作为已确定标签样本输入到目标业务模型中,并训练目标业务模型。
可选的,计算所述风险标签中相同风险标签的数量,具体包括:
基于设定的算法,计算所述风险标签之间的相似度;
将相似度达到阈值的风险标签确定为相同风险标签,并统计相同风险标签的数量。
可选的,所述设定的算法,包括:
模糊匹配算法、语义近似匹配算法。
可选的,所述方法还包括:
将所述共识风险标签推送给所述多个客户端。
根据本说明书实施例的第二方面,提供一种反洗钱审理标签处理方法,所述方法包括:
将被审理的账户信息发送给多个审理客户端,并收集所述多个审理客户端针对该被审理的账户信息标注的审理标签;其中,所述审理标签表示审理客户端对被审理的账户信息进行反洗钱审理得出的审理结果;
计算所收集到的审理标签中相同审理标签的数量,并将达到阈值的审理标签确定为共识审理标签;
将所述具有共识审理标签的账户信息作为已确定标签样本输入到反洗钱审理模型中,并训练反洗钱审理模型。
可选的,计算所述审理标签中相同审理标签的数量,具体包括:
基于设定的算法,计算所述审理标签之间的相似度;
将相似度达到阈值的审理标签确定为相同审理标签,并统计相同审理标签的数量。
可选的,所述方法还包括:
将所述共识审理标签推送给所述多个审理客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910095194.0/2.html,转载请声明来源钻瓜专利网。