[发明专利]获取实体间关系表达的方法、系统和设备、广告召回系统有效
| 申请号: | 201910041481.3 | 申请日: | 2019-01-16 |
| 公开(公告)号: | CN111444395B | 公开(公告)日: | 2023-05-16 |
| 发明(设计)人: | 温世阳;陈怡然;吴文金;林伟;朱晓宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9535;G06N20/00 |
| 代理公司: | 北京思格颂知识产权代理有限公司 11635 | 代理人: | 杨超 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 获取 实体 关系 表达 方法 系统 设备 广告 召回 | ||
1.一种广告召回系统,其特征在于,包括获取实体间关系表达的系统和广告召回匹配系统;
所述获取实体间关系表达的系统,用于将预先构建的异构图按照边的类型,拆分为子图,一个子图包括一种类型的边;所述异构图中的节点类型包括:广告、商品、查询词中的至少一种,所述边的类型包括点击边、共同点击边、协同过滤边、内容语义相似边和属性相似边中的至少一种;
针对每个子图进行采样,得到每个子图的样本集合,样本集合的每条样本中包括一个源节点、一个正节点和至少一个负节点;
将每个子图的同一个批次的样本集合输入预设的机器学习模型进行训练,分别得到每个子图的样本集合中各条样本的源节点的向量表达、正节点的向量表达和每个负节点的向量表达;基于得到的各节点的向量表达使用预设的损失函数对机器学习模型中的参数进行优化;
预设的聚合模型,对不同子图中的相同源节点的向量表达进行聚合学习,得到所述相同源节点的一个向量表达;基于所述相同源节点的一个向量表达和该源节点在各子图的样本中包括的正节点的向量表达和每个负节点的向量表达,使用预设的损失函数对聚合模型的参数进行优化;
重复上述流程对所有批次的样本集合进行预设次数的训练,得到所述异构图中每个节点的一个低维向量表达,异构图中的一个节点对应样本数据中的一个实体;
所述广告召回匹配系统,用于使用所述获取实体间关系表达的系统得到的查询词节点、商品节点和搜索广告节点的低维向量表达,确定查询词节点、商品节点和搜索广告节点之间的匹配程度,根据所述匹配程度选择与商品、查询词匹配程度符合设定要求的搜索广告。
2.如权利要求1所述的系统,其特征在于,所述获取实体间关系表达的系统针对每个子图进行采样,得到每个子图的样本集合,包括:
针对每个子图,以选择节点为起点分别进行随机游走,得到每个子图对应的至少一个节点序列;用预设的滑动窗口,从所述节点序列中,得到每个子图对应的正样本集合,所述正样本集合中的一条正样本包括一个源节点与一个正节点;
基于每个子图对应的正样本集合进行一次负节点的采样,得到每个子图对应的样本集合,所述样本集合中的一条样本包括一个源节点、一个正节点和至少一个负节点,所述负节点与正节点的分布具有一致性,所述负节点与源节点的预设属性具有相关性。
3.如权利要求1所述的系统,其特征在于,所述获取实体间关系表达的系统将每个子图的同一个批次的样本集合输入预设的机器学习模型进行训练,分别得到每个子图的样本集合中各条样本的源节点的向量表达、正节点的向量表达和每个负节点的向量表达,包括:
针对每个子图的同一批次的样本集合,将样本集合中每条样本包括的源节点、正节点、负节点及各节点的属性信息输入到机器学习模型中;
经机器学习模型的嵌入层,将样本中包括的节点的稀疏特征映射成稠密特征;
源节点的稠密性特征经过对应的一个机器学习模型网络训练得到源节点的向量表达,正节点和负节点的稠密性特征经过对应的一个机器学习模型训练得到正节点和各负节点的向量表达。
4.如权利要求1所述的系统,其特征在于,所述获取实体间关系表达的系统基于得到的各节点的向量表达使用预设的损失函数对机器学习模型中的参数进行优化,包括:
根据训练得到的各条样本的源节点的向量表达、正节点的向量表达和每个负节点的向量表达,计算源节点和正节点、各负节点的余弦距离;
预设的损失函数基于所述余弦距离对机器学习模型中的参数进行优化。
5.如权利要求1所述的系统,其特征在于,所述获取实体间关系表达的系统通过预设的聚合模型,对不同子图中的相同源节点的向量表达进行聚合学习,得到所述相同源节点的一个向量表达,包括:
根据每个子图训练得到的源节点的每个向量表达和对应的学习权重因子,确定所述源节点的从每个子图中训练得到的向量表达的权重;
使用确定出来的权重对所述源节点从每个子图中训练得到的向量表达进行加权求和,得到所述源节点聚合后的一个向量表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041481.3/1.html,转载请声明来源钻瓜专利网。





