[发明专利]无类型标签用户数据的处理方法、装置、电子设备和介质有效

专利信息
申请号: 202210308309.1 申请日: 2022-03-28
公开(公告)号: CN114418752B 公开(公告)日: 2022-07-12
发明(设计)人: 郭翊麟;孙悦;蔡准;郭晓鹏 申请(专利权)人: 北京芯盾时代科技有限公司
主分类号: G06Q40/02 分类号: G06Q40/02;G06Q40/04;G06K9/62;G06N3/08
代理公司: 北京乐知新创知识产权代理事务所(普通合伙) 11734 代理人: 周伟
地址: 102300 北京市门头*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 类型 标签 用户 数据 处理 方法 装置 电子设备 介质
【权利要求书】:

1.一种无类型标签用户数据的处理方法,其特征在于,所述方法包括:

根据用户的交易特征数据对用户进行聚类,得到特定数量的簇;

确定所述簇为无类型标签簇或有类型标签簇;所述无类型标签簇中包含无类型标签用户,所述有类型标签簇中不包含无类型标签用户;所述类型标签用于指示所述用户异常或正常;

选取特定数量的无类型标签簇作为样本簇;

从所述样本簇中选取相似度最大的特定数量的第一用户,根据被选取的第一用户构建正样本对;

将两两样本簇构成对应的样本簇对;计算每个样本簇对的簇对中心点距离,所述簇对中心点距离为样本簇对中两个样本簇的中心点之间的距离;

按照所述簇对中心点距离从大到小的顺序,选取特定数量的样本簇对,并从中抽取一个样本簇对,得到相似度满足设定条件的两个样本簇,分别从该两个样本簇选取所述第一用户,根据被选取的第一用户构建负样本对;

为所述正样本对配置相似的相似度标签,为所述负样本对配置不相似的相似度标签;

将具有相似度标签的正样本对和负样本对构建为无类型标签样本集合。

2.根据权利要求1所述的方法,其特征在于,所述得到特定数量的簇之后,且确定所述簇为无类型标签簇或有类型标签簇之前,该方法还包括:

统计每个簇中有类型标签的用户数量和无类型标签的用户数量,若所述簇中有类型标签的用户数量大于无类型标签的用户数量,且有类型标签的用户类型标签的标签值全为正常或全为异常,则为所述簇中的无类型标签的用户生成类型标签。

3.根据权利要求2所述的方法,其特征在于,为所述簇中的无类型标签的用户生成类型标签,包括:

若所述簇中有类型标签的用户的类型标签的标签值全为正常,则所述簇中的无类型标签的用户的类型标签的标签值设为正常;若所述簇中有类型标签的用户的类型标签的标签值全为异常,则所述簇中的无类型标签的用户的类型标签的标签值设为异常。

4.根据权利要求1所述的方法,其特征在于,所述选取特定数量的无类型标签簇作为样本簇,包括:

对于任意一个无类型标签簇,根据该簇中各用户的交易特征数据确定该簇的中心点,并计算该簇的中心点与其他所有无类型标签簇的中心点之间的平均距离;

按照每个无类型标签簇对应的所述平均距离从大到小的顺序,选取特定数量的无类型标签簇作为样本簇。

5.根据权利要求4所述的方法,其特征在于,从样本簇中选取相似度最大的特定数量的第一用户,包括:

计算所述样本簇中各个用户的用户中心点距离,所述用户中心点距离为所述用户与所述样本簇中心点的距离;

按照所述用户中心点距离从小到大的顺序,从所述样本簇中选取特定数量的第一用户。

6.根据权利要求5所述的方法,其特征在于,

根据被选取的第一用户构建正样本对,包括:

被选取的所述第一用户分别与所述中心点组成相应的正样本对;

根据被选取的第一用户构建负样本对,包括:

被选取的两个样本簇中的被选取的第一用户两两组成相应的负样本对。

7.根据权利要求1所述的方法,其特征在于,所述确定所述簇为无类型标签簇或有类型标签簇之后,该方法还包括:将所有的簇中的有类型标签的用户组成有类型标签样本集合;

相应的,该方法还包括:

所述有类型标签样本集合与所述无类型标签样本集合构成训练样本,将所述训练样本输入深度学习模型训练,优化所述深度学习模型,得到优化后的深度学习模型;

基于待识别的用户的交易特征数据,通过所述优化后的深度学习模型,确定所述待识别的用户的类型为异常或正常。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京芯盾时代科技有限公司,未经北京芯盾时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210308309.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top