[发明专利]一种可信子图的挖掘方法、装置以及设备有效
| 申请号: | 202010631573.X | 申请日: | 2020-07-03 |
| 公开(公告)号: | CN111522866B | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 周璟;宝鹏庆;肖凯;陆毅成;吕乐;赵闻飙;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/04;G06N3/08 |
| 代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 刘立升 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 可信 挖掘 方法 装置 以及 设备 | ||
1.一种可信子图的挖掘方法,包括:
基于目标点的业务行为和/或业务关系构边,获得待处理的图数据对应的子图;
基于元可信召回策略遍历所述子图,获得备择子图,其中,所述元可信召回策略是基于业务特点预先定义的进行子图沉淀的格式;
基于第一模型,对所述备择子图进行分类,获得所述备择子图的表征向量、所述备择子图的整体表征及所述备择子图的第一分值,其中,所述第一模型是基于图神经网络预先训练获得的模型,所述第一分值用于对所述备择子图进行子图分类,以表示所述备择子图是否可信;
基于所述备择子图的表征向量、所述备择子图的整体表征,采用第二模型获得所述备择子图的第二分值,其中,所述第二模型是基于树模型预先训练获得的模型,所述第二分值表示所述备择子图的风险概率;
基于所述第一分值和所述第二分值,对所述备择子图进行子图沉淀,获得可信子图。
2.如权利要求1所述的方法,所述基于目标点的业务行为和/或业务关系构边,获得待处理的图数据对应的子图,具体包括:
根据业务含义,解析所述业务中的实体目标作为目标点;
基于所述目标点,以所述目标点之间的业务关系构边,获得所述待处理的图数据对应的子图。
3.如权利要求1所述的方法,所述基于元可信召回策略遍历所述子图,获得备择子图,具体包括:
基于所述元可信召回策略遍历各个子图,并对所述子图中的可信点和/或可信边和/或可信子图进行剪枝,获得所述备择子图,所述元可信召回策略是从交易的主动方出发,以交易的被动方结束,确定可信关系对的策略。
4.如权利要求3所述的方法,所述对所述子图中的可信点和/或可信边和/或可信子图进行剪枝,具体包括:
基于所述元可信召回策略,排除(k-1)维中的可信点和/或可信边和/或可信子图,对所述子图中的可信点和/或可信边和/或可信子图进行剪枝,所述子图中的可信点和/或可信边和/或可信子图对应的备择子图是不需要进行召回的,其中,k为所述备择子图的维度。
5.如权利要求1所述的方法,所述基于第一模型,对所述备择子图进行分类,获得所述备择子图的表征向量、所述备择子图的整体表征及所述备择子图的第一分值,具体包括:
将所述备择子图输入所述第一模型,获得所述备择子图的表征向量、所述备择子图的整体表征及所述备择子图的第一分值。
6.如权利要求1所述的方法,所述第一模型是基于图神经网络预先训练获得的模型,具体包括:
将已知的备择子图及所述已知的备择子图中的邻居节点的作为输入,采用Attention网络和/或LSTM-style网络和/或Lazy-walk机制进行训练,获得所述第一模型。
7.如权利要求6所述的方法,所述Attention网络的表达为自适应广度函数,所述自适应广度函数的表达式为:
H(tmp)=φ(A,H(t-1);Θ)
其中,
H(tmp)表示自适应广度函数的输出;
φ表示自适应广度函数;
A为邻居矩阵;
t表示深度;
Θ表示输出的参数矩阵;
H(t-1)表示第t-1步自适应深度函数的输出。
8.如权利要求6所述的方法,所述LSTM-style网络的表达为自适应深度函数,所述自适应深度函数的表达式为:
其中,
H(t)表示随着深度t的变化,自适应深度函数的t深度的输出;
表示自适应深度函数;
Ф表示输出的参数矩阵;
t表示深度;
H(tmp)表示自适应广度函数的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010631573.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:监控摄像机
- 下一篇:确定两个实体间的关系紧密度的方法、装置及电子设备





