[发明专利]一种基于关联网络的目标节点关键信息填补方法及系统有效
申请号: | 201910939414.3 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110706095B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 郑乐;韩晗;刘嵩;陈锐浩;毛正冉;王张琦 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q50/00 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 徐金琼 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关联 网络 目标 节点 关键 信息 填补 方法 系统 | ||
1.一种基于关联网络的目标节点关键信息填补方法,其特征在于,包括如下步骤:
S1、根据应用场景,基于大量的节点中的各节点建立关系网络,得到大量的关系网络;
S2、基于大量的关系网络,获取有关键信息的节点作为目标节点,将其对应的关系网络作为关联网络整合成包含目标节点、目标节点对应的关键信息的标签、目标节点对应的关联节点、各关联节点的节点权重和与目标节点的关键信息相关联的、各关联节点的属性向量的数据结构,即得到整合后的训练集,其中,关键信息是指需要预测的行为;
S3、基于改进的随机森林法对整合后的训练集进行多次三维采样,得到多个训练决策树的子集;
S4、基于多个训练决策树的子集,给定多个相对应的决策树进行训练,对多个训练后的决策树进行整合,即得到最终模型;
S5、基于待填补关键信息的目标节点的关联节点的特征向量和权重,通过最终模型进行预测,得到多个结果,将多个结果加权平均,得到最终的填补信息,即关键信息;
所述步骤S1中的应用场景包括金融信贷场景、电商推荐场景或健康评估场景;关系网络的维度包括已知的节点的常用联系人、已知的节点的亲属关系、已知的节点的朋友、已知的节点的同事;关系网络中的关联节点根据关系疏远程度给予不同的权重或平均分配权重;大量的节点为一万个节点以上,关系网络的数量与节点的数量相同;
所述步骤S2的具体步骤为:
S2.1、基于大量的关系网络,采用有监督的机器学习方法准备训练样本,即在大量的关系网络中挑选有关键信息的节点作为目标节点,即训练样本,挑选的所有的有关键信息的目标节点构成训练集,其中,关键信息是指需要预测的行为,在金融信贷场景,包括用户是否违约;在电商推荐场景,包括用户是否有购买意向;在健康评估场景,包括用户患有某种疾病的风险的大小;
S2.2、将各训练样本的关系网络作为关联网络整合成包含目标节点、目标节点对应的关键信息的标签、目标节点对应的关联节点、各关联节点的节点权重和与目标节点的关键信息相关联的、各关联节点的属性向量的数据结构,即得到整合后的训练集。
2.根据权利要求1所述的一种基于关联网络的目标节点关键信息填补方法,其特征在于,所述步骤S2.2中,在金融信贷场景,属性向量包括关联节点的历史借款记录、收入、学历和年龄;在电商推荐场景,属性向量包括浏览数据和购买数据;在健康评估场景,属性向量包括身体素质评估、患病年龄、患病种类、饮食习惯和生活习惯。
3.根据权利要求1或2所述的一种基于关联网络的目标节点关键信息填补方法,其特征在于,所述步骤S3的具体步骤为:
S3.1、样本扰动:采用自助抽样法从整合后的训练集中均匀、有放回地选出m个包含目标节点数为N'的子集Di,m为抽样次数,N'为每个子集包含的目标节点个数,与原训练集中的目标节点数量相同,Di为m个子集中的第i个子集;
S3.2、属性类别扰动:基于目标节点数为N'的各子集Di,已知关联节点属性向量维度为K,从K维里随机抽取不超过K维的属性向量Ki作为子集Di的属性向量,即各目标节点的关联节点的属性向量为Ki,其中,Ki代表第i个子集经属性类别扰动后的属性向量;
S3.3、属性值扰动:针对属性类别扰动后的各子集Di中的每个目标节点ON,进行属性值扰动,即已知目标节点ON有M个关联节点RNM、M个关联权重WNM、M个属性向量组XNM,基于子集的属性向量Ki,属性值为从M个属性向量组XNM中按照权重抽样得到,每个属性向量被抽取到的概率是其中,Pj为第j个关联节点属性值被取到的概率,Wj为第j个关联节点对应的权重,为所有关联节点的权重和;
S3.4、对m个子集Di依次进行属性类别扰动和属性值扰动抽样后,得到m个训练决策树的子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910939414.3/1.html,转载请声明来源钻瓜专利网。