[发明专利]一种基于关联网络的目标节点关键信息填补方法及系统有效
申请号: | 201910939414.3 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110706095B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 郑乐;韩晗;刘嵩;陈锐浩;毛正冉;王张琦 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q50/00 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 徐金琼 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关联 网络 目标 节点 关键 信息 填补 方法 系统 | ||
本发明公开了一种基于关联网络的目标节点关键信息填补方法及系统,属于数据挖掘、机器学习和图论技术领域。解决现有技术中,填补的目标节点的关键信息准确率低的问题。本发明根据应用场景,建立大量节点的关系网络;基于各关系网络,获取有关键信息的目标节点的关联网络,将关联网络整合成包含目标节点、标签、关联节点、关联节点权重和属性向量的数据结构,基于改进的随机森林法对数据结构进行多次三维采样,得到多个训练决策树的子集,给定多个决策树进行训练,训练后整合得到最终模型;基于待填补的目标节点的关联节点,通过最终模型进行预测,预测后将多个结果加权平均,得到最终的填补信息。本发明基于关联网络,对目标节点的关键信息填补。
技术领域
一种基于关联网络的目标节点关键信息填补方法及系统,用于基于关联网络,对目标节点的关键信息填补,属于数据挖掘、机器学习和图论技术领域。
背景技术
在许多场景中,都存在目标信息不足情况下,有预测目标关键信息的需求。具体场景包括金融信贷领域、电商推荐领域和健康评估领域,以及其它领域。
场景一:金融信贷领域,如何对信用白户准入进行信用评估。信用白户自身没有足够的基础信贷信息供金融机构评估其还款意愿与还款能力,此时利用目标节点亲密关系人(即紧邻的网络节点)的相关信息,可以为目标节点的还款意愿进行评估。而关联网络的建立可以依靠金融机构的存量节点数据及目标节点进件时填写的紧急联系人信息、亲属信息及电话频繁联系人等维度构建。
场景二:电商推荐领域。目标节点活跃度较低时,即没有购物记录与鲜有浏览信息的情况下,如何预测其潜在的购物倾向,进而实现更加精准产品推荐。可以利用其社交信息建立关联网络,从邻近的网络节点中采集关联节点的浏览数据、购买数据等,建立模型评估目标节点的购物倾向。
场景三:健康评估领域。具体来说,如何对一个尚且健康的人预测未来某类疾病患病几率。已知家族病史具有一定的科学依据,可以利用人的亲属关系构建关联网络,利用关联节点的身体素质评估、患病年龄、患病种类、饮食习惯、生活习惯等维度信息,来对目标人的某类疾病的患病几率做预测,进而更早做好疾病预防工作。
最典型的场景是金融领域如何对信用白户授信。当新申请用户鲜有历史信贷记录(缺乏特征变量),贷款机构无法利用已有的评分模型对其信用风险进行评估。对于这种情况,目前采用的一般性方法有:
1.对用户缺失的特征维度,按照存量用户的平均值、中值、分位数、众数、随机值等替代,然后入模打分;缺失特征维度的填补效果较差,等于人为增加了噪声。
2.用其他已知特征做预测模型来算出缺失变量。问题在于,如果其他变量本身较少,并且与缺失特征无任何关联,预测的结果毫无意义;如果预测结果相当准确,则又说明预测变量与已知变量强相关,没必要加入模型中,所以造成尺度(即指未知特征对已知特征的拟合尺度)很难把握。
3.忽视这些特征维度,寻找其他的特征维度用以替代。常用方法是如果用户没有相关的特征变量,那就查找第三方与之对应的特征数据用以替代。该方法理论上有效,但是有以下问题:首先,该方法有对应特征存在假设,可能需要花非常多的精力、经费去寻找对应特征,有时甚至不可得。其次,如果用户缺失特征维度较多,即便是找到少许维度的对应特征,整体的特征缺失率仍然很高,还是无法对用户的关键行为做出准确的预测。
随着图论的发展,利用关联网络来预测目标节点的关键信息成为另一个可能性。人与人之间存在复杂的社交关系,利用社交关系建立的网络,网络里的人群行为往往存在相关性。以信用风险预测场景为例,目前采用关联网络来预测节点违约的主要步骤如下:
1.定义一个复杂网络,根据网络节点与目标节点的距离(亲疏关系),定义一阶邻近节点、二阶邻近节点。
2.信用风险的传递,主要分为了两种方法:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910939414.3/2.html,转载请声明来源钻瓜专利网。