[发明专利]获取实体间关系表达的方法、系统和设备、广告召回系统有效

专利信息
申请号: 201910041481.3 申请日: 2019-01-16
公开(公告)号: CN111444395B 公开(公告)日: 2023-05-16
发明(设计)人: 温世阳;陈怡然;吴文金;林伟;朱晓宇 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/901 分类号: G06F16/901;G06F16/9535;G06N20/00
代理公司: 北京思格颂知识产权代理有限公司 11635 代理人: 杨超
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 获取 实体 关系 表达 方法 系统 设备 广告 召回
【说明书】:

发明公开了一种获取实体间关系表达的方法、系统和设备、广告召回系统。所述方法包括:将异构图按照边的类型拆分为子图,对子图进行采样,得到样本集合,将样本集合输入机器学习模型,得到每个子图的样本集合中各条样本的源节点、正节点和每个负节点的向量表达;基于得到的向量表达优化模型参数;对不同子图中的相同源节点的向量表达进行聚合,得到相同源节点的向量表达;基于相同源节点的向量表达、正节点和每个负节点的向量表达,优化聚合模型参数;重复上述流程得到异构图中每个节点的低维向量表达。能够实现对复杂的异构图的学习,处理速度块、效率高,用于广告搜索时使召回广告的匹配度更高。

技术领域

本发明涉及数据挖掘技术领域,特别涉及一种获取实体间关系表达的方法、系统和设备、广告召回系统。

背景技术

随着移动终端及应用软件的普及,在社交、电商、物流、出行、外卖、营销等领域的服务提供商沉淀了海量业务数据,基于海量业务数据,挖掘不同业务实体(实体)之间的关系成为数据挖掘领域一个重要的技术研究方向。而随着机器处理能力的提升,越来越多技术人员开始研究如何通过机器学习技术进行挖掘。

本发明的发明人发现:

目前,通过机器学习技术,对海量业务数据进行学习,得到用于表达实体及实体之间关系的图(Graph),即,对海量业务数据进行图学习,成为一个优选的技术方向。简单理解,图由节点和边构成,一个节点用于表示一个实体,节点与节点之间的边用于表示节点之间的关系。一张图一般会包括两个以上的节点和一条以上的边,因此,图也可以理解为由节点的集合和边的集合组成,通常表示为:G(V,E),其中,G表示图,V表示图G中节点的集合,E是图G中边的集合。图可以分为同构图和异构图,其中,异构图指的是一张图中的节点的类型不同(边的类型可以相同或者不同),或者一张图中边的类型不同(节点的类型可以相同或者不同)。所以,当实体的类型较多需要用多种类型的节点来表达,或者,实体之间的关系不唯一需要用多种类型的边来表达时,优选通过异构图表达这些实体及这些实体之间的关系,而当异构图包括的节点和边的量级很大时,该异构图会异常复杂且数据量会非常庞大,因此,降低异构图的复杂度及数据量成为本领域技术人员面临的技术问题。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种异构图学习方法、系统和设备。

本发明实施例提供一种广告召回系统,包括获取实体间关系表达的系统和广告召回匹配系统;

所述获取实体间关系表达的系统,用于将预先构建的异构图按照边的类型,拆分为子图,一个子图包括一种类型的边;所述异构图中的所述节点类型包括:广告、商品、查询词中的至少一种,所述边的类型包括点击边、共同点击边、协同过滤边、内容语义相似边和属性相似边中的至少一种;

针对每个子图进行采样,得到每个子图的样本集合,样本集合的每条样本中包括一个源节点、一个正节点和至少一个负节点;

将每个子图的同一个批次的样本集合输入预设的机器学习模型进行训练,分别得到每个子图的样本集合中各条样本的源节点的向量表达、正节点的向量表达和每个负节点的向量表达;基于得到的各节点的向量表达使用预设的损失函数对机器学习模型中的参数进行优化;

预设的聚合模型,对不同子图中的相同源节点的向量表达进行聚合学习,得到所述相同源节点的一个向量表达;基于所述相同源节点的一个向量表达和该源节点在各子图的样本中包括的正节点的向量表达和每个负节点的向量表达,使用预设的损失函数对聚合模型的参数进行优化;

重复上述流程对所有批次的样本集合进行预设次数的训练,得到所述异构图中每个节点的一个低维向量表达,异构图中的一个节点对应样本数据中的一个实体。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910041481.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top