[发明专利]一种确定多个样本之间的网络结构的方法及装置有效
申请号: | 201910059767.4 | 申请日: | 2019-01-22 |
公开(公告)号: | CN110059227B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 梁琛 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06Q40/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张静娟;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 样本 之间 网络 结构 方法 装置 | ||
本说明书实施例提供了一种确定多个样本之间的全局网络结构的方法和装置,其中,所述多个样本中包括被标注为不同类型的样本,其中,所述不同类型中包括至少一种目标类型,所述方法包括:在获取所述多个样本的至少两个全局网络结构后;首先在每个全局网络结构中,对于所述多个样本中的至少一种目标类型中的每种目标,基于该目标类型的样本各自的与其邻居样本之间的局部网络结构、及各个所述邻居样本的类型,计算该各种目标类型的样本在该网络结构中的聚集性;然后基于各种目标类型的样本在各个全局网络结构中的聚集性,在所述至少两个全局网络结构中确定所述多个样本之间的全局网络结构。
技术领域
本说明书一个或多个实施例涉及计算机信息处理领域,尤其涉及一种确定多个样本之间的网络结构的方法及装置。
背景技术
多个样本的网络结构(拓扑结构)是对多个样本之间关系的一种描述。基于多个样本之间的网络结构可获取对应于该多个样本的关系网络图。图嵌入算法的输入是关系网络图中所有节点之间的网络结构,以及每个节点的特征。在不同应用中,网络结构和节点的特征均有多种可能性。比如,在保险风控场景,为了判断某个节点(支付宝账户)是不是骗保账户,可以对账户之间的转账关系、设备共用关系、wifi共用关系、好友关系分别构图。这时,网络结构已经有了四种选择。对于图嵌入算法,需要在这些可能的构图中选择一种,输入到算法中。对于不同的网络结构和节点的特征的选择,可能会影响最终分类任务的结果。在目前常用的选择方案中,为每一种网络结构对应的关系图搭建一个图嵌入模型,在分别训练之后,比较这些模型的表现。因此,需要一种更有效的确定样本之间的网络结构的方案。
发明内容
本说明书一个或多个实施例描述了一种确定多个样本之间的网络结构的方法及装置,可以高效地确定适合特定场景的网络结构。
根据第一方面,提供了一种确定多个样本之间的全局网络结构的方法,其中,所述多个样本中包括被标注为不同类型的样本,其中,所述不同类型中包括至少一种目标类型,所述方法包括:
获取所述多个样本的至少两个全局网络结构;
在每个全局网络结构中,对于所述至少一种目标类型中的每种目标类型,基于该目标类型的样本各自的与其邻居样本之间的局部网络结构、及各个所述邻居样本的类型,计算该目标类型的样本在该全局网络结构中的聚集性,其中,所述邻居样本为预定阶数以内的邻居样本;
基于各种目标类型的样本在各个全局网络结构中的聚集性,在所述至少两个全局网络结构中确定所述多个样本之间的全局网络结构。
在一个实施例中,其中,所述至少两个全局网络结构中包括第一网络结构,所述至少一种目标类型包括第一目标类型,在所述第一网络结构中,所述第一目标类型的样本的聚集性对应于第一目标类型的样本与其各阶全部同类型邻居样本之间的聚集性的加权和,其中,所述第一目标类型的样本与其n阶全部同类型邻居样本之间的聚集性基于如下两项获取:所述第一目标类型的样本各自的与其n阶邻居样本之间的网络结构、及所述n阶邻居样本各自的类型,其中n为大于0的整数。
在一种可能的实现方式中,其中,所述邻居样本为至多预定阶数的邻居样本。
进一步地,预定阶数为3。
在一种可能的实现方式中,其中,第一目标类型的样本与其n阶全部同类型邻居样本之间的聚集性为第一目标类型的各样本的n阶同类型邻居样本数之和与第一目标类型的各样本的n阶邻居样本数之和的比值。
进一步地,其中,n阶同类型邻居样本数之和与n阶邻居样本数之和分别基于所述第一网络结构对应的邻接矩阵的n次幂获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910059767.4/2.html,转载请声明来源钻瓜专利网。